Một xu hướng mới đang nhanh chóng lan tỏa trên các nền tảng mạng xã hội, cho thấy sức mạnh vượt trội của các mô hình AI mới từ OpenAI.
Chỉ vài ngày sau khi OpenAI ra mắt các mô hình AI lý luận mới như o3 và o4-mini, người dùng đã phát hiện ra khả năng ấn tượng và có phần đáng lo ngại của chúng. Với khả năng suy luận từ hình ảnh – bao gồm việc cắt, xoay, phóng to và phân tích ngay cả những bức ảnh mờ hoặc biến dạng – kết hợp với khả năng tìm kiếm web, hiện có thể hoạt động như một công cụ tìm kiếm địa điểm cực kỳ hiệu quả.
Trên mạng xã hội X (Twitter), người dùng đang thử nghiệm tính năng này. Họ tải lên đủ loại hình ảnh: từ thực đơn nhà hàng, góc phố, mặt tiền tòa nhà đến ảnh selfie, rồi yêu cầu mô hình o3 đóng vai trò người chơi "GeoGuessr" – một trò chơi online nổi tiếng yêu cầu đoán vị trí từ ảnh Google Street View. Thật ngạc nhiên, trong nhiều trường hợp, o3 đã xác định đúng thành phố, địa danh, thậm chí cả tên nhà hàng, quán bar chỉ từ những chi tiết hình ảnh tinh tế. Cơ chế này dường như không dựa vào lịch sử trò chuyện cũ hay dữ liệu EXIF, mà chủ yếu phân tích nội dung hình ảnh và đối chiếu với thông tin từ web.

Nhiều người dùng đang thử nghiệm khả năng suy luận vị trí của o3. Ảnh: Lifehacker
Khả năng này ngay lập tức làm dấy lên những lo ngại về quyền riêng tư. Một tình huống dễ tưởng tượng là kẻ xấu có thể chụp lại ảnh trên Instagram Story hoặc một bài đăng trên mạng xã hội, rồi dùng để xác định vị trí của người đăng, tạo ra nguy cơ lộ thông tin cá nhân.
Điều đáng lo là hiện tại có rất ít biện pháp bảo vệ được tích hợp để ngăn chặn việc "tra cứu vị trí ngược" trong . Báo cáo an toàn mà OpenAI công bố cùng với o3 và o4-mini cũng không đề cập trực tiếp đến vấn đề này.
Trong một thử nghiệm của TechCrunch, kết quả khá bất ngờ khi mô hình GPT- cũ hơn (không có khả năng lý luận hình ảnh chuyên sâu) trong nhiều trường hợp vẫn xác định được vị trí chính xác như o3, thậm chí còn nhanh hơn. Tuy nhiên, có ít nhất một trường hợp o3 vượt trội khi nhận diện đúng một quán bar chỉ từ hình ảnh chiếc đầu tê giác màu tím trên tường, trong khi GPT- lại đoán sai là một quán rượu ở Anh. Điều này cho thấy o3 có khả năng tốt hơn trong việc nhận diện những manh mối hình ảnh tinh vi hoặc đặc biệt.
Dù vậy, o3 không phải là hoàn hảo. Các thử nghiệm cũng chỉ ra rằng mô hình này đôi khi bị "kẹt", không thể đưa ra câu trả lời chính xác, hoặc xác định sai địa điểm. Nhiều người dùng trên X cũng đã báo cáo những kết quả suy luận vị trí thiếu chính xác.

Mô hình o3 có khả năng lập luận tốt nhưng vẫn chưa hoàn thiện. Ảnh: TechRadar
Vài giờ sau khi TechCrunch đăng tải thông tin này, OpenAI đã đưa ra phản hồi chính thức. Công ty khẳng định rằng khả năng lý luận hình ảnh của o3 và o4-mini mang lại nhiều lợi ích (hỗ trợ người khuyết tật, nghiên cứu, xác định vị trí khẩn cấp). OpenAI cũng nhấn mạnh rằng họ đã huấn luyện mô hình từ chối các yêu cầu liên quan đến thông tin riêng tư/nhạy cảm, bổ sung các biện pháp bảo vệ nhằm ngăn chặn việc xác định danh tính cá nhân trong ảnh, và tích cực giám sát, xử lý các hành vi lạm dụng liên quan đến quyền riêng tư.
Trào lưu "thám tử" qua đã phô bày những khả năng ấn tượng mới của AI tạo sinh, đồng thời là minh chứng rõ ràng cho những nguy cơ tiềm ẩn. Dù OpenAI đã cam kết đảm bảo an toàn và bảo mật, việc người dùng có thể dễ dàng sử dụng công cụ này để suy luận vị trí qua ảnh chụp cho thấy thách thức trong việc xây dựng những hàng rào bảo vệ hiệu quả khi AI ngày càng mạnh mẽ và đa năng hơn. Cuộc tranh luận về việc cân bằng giữa khả năng của AI và sự an toàn, quyền riêng tư của người dùng sẽ tiếp tục diễn ra.
Theo TechCrunch, Lifehacker
Nguyễn Nghĩa
