có thể sẽ nhanh chóng nhận diện và phân tích hình ảnh từ camera của người dùng trong tương lai gần.
Gần đây, cộng đồng công nghệ đang bàn tán về khả năng xử lý hình ảnh trực tiếp của , một bước tiến đáng chú ý trong việc phát triển trí tuệ nhân tạo. Những dòng mã ẩn trong phiên bản beta mới nhất của v1.2024.317 đã hé lộ tính năng mang tên 'Live camera', hứa hẹn mở ra một kỷ nguyên mới cho .
Theo Android Authority, mã nguồn trong chế độ 'Advanced Voice Mode' không chỉ cảnh báo người dùng rằng 'không nên dùng Live camera để đưa ra quyết định về sức khỏe hay an toàn', mà còn chỉ dẫn cụ thể: 'Nhấn vào biểu tượng camera để cho phép quan sát và trò chuyện về môi trường xung quanh bạn.'

Điều này làm tăng thêm hy vọng rằng sẽ có thể nhận diện và hiểu các hình ảnh từ camera của người dùng trong thời gian tới. Nếu tính năng này được triển khai, sẽ đạt đến một tầm cao mới, vượt xa các ứng dụng AI chỉ hoạt động với văn bản và âm thanh.
Khả năng xử lý hình ảnh của không còn quá bất ngờ, vì tại sự kiện OpenAI vào tháng 5 vừa qua, GPT- đã được trình làng với khả năng 'nhìn' và hiểu các hình ảnh. Một trong những bản demo ấn tượng là khi GPT- sử dụng camera để nhận diện một chú chó đang chơi tennis và nhớ tên chú chó là 'Bowser.'
Tuy nhiên, kể từ đó, OpenAI khá im lặng về tiến độ phát triển tính năng này. Trong khi đó, chế độ Advanced Voice Mode đã được phát hành cho người dùng Plus và Team từ tháng 9, khiến người dùng càng thêm háo hức chờ đón khả năng xử lý hình ảnh.
Nếu tính năng Vision của được triển khai theo như những gợi ý từ mã nguồn, người dùng sẽ có cơ hội trải nghiệm toàn bộ những khả năng mà OpenAI đã hứa hẹn. Điều này bao gồm việc nhận diện vật thể, phân tích môi trường xung quanh, và hỗ trợ giải quyết các tình huống thực tế thông qua trí tuệ nhân tạo.
Dù có nhiều lo ngại về việc AI đang dần đạt đến 'điểm bão hòa', OpenAI vẫn không ngừng thúc đẩy sự phát triển. Vừa qua, hãng đã ra mắt Search, giúp AI truy cập thông tin thời gian thực từ internet. Ngoài ra, còn có thông tin rò rỉ rằng OpenAI đang phát triển một 'trợ lý AI' mới, có thể xử lý các tác vụ phức tạp như lập trình và duyệt web, dự kiến sẽ ra mắt vào tháng 1 năm sau.
Khả năng nhận diện và hiểu môi trường xung quanh qua camera của không chỉ gia tăng tính ứng dụng mà còn mở ra nhiều cơ hội mới cho các ngành như giáo dục, y tế và hỗ trợ người dùng trong các tình huống hàng ngày. Tuy nhiên, điều này cũng đặt ra những câu hỏi về quyền riêng tư và việc bảo vệ dữ liệu hình ảnh một cách an toàn.
Mặc dù OpenAI chưa có thông báo chính thức, nhưng với sự phát triển nhanh chóng hiện nay, việc có khả năng 'thấy và hiểu' hình ảnh sớm trở thành một phần của cuộc sống thường ngày là điều hoàn toàn khả thi.
