TPO - OpenAI tiết lộ rằng họ đã cập nhật ChatGPT để trở nên giống con người hơn bao giờ hết. Phiên bản mới nhất của ChatGPT về trợ lý giọng nói hiện có thể phản hồi các đầu vào âm thanh, văn bản và hình ảnh trong thời gian thực.
Màn hình điện thoại hiển thị GPT-4o |
ChatGPT-4o sẽ được triển khai cho những người thử nghiệm trong vài tuần tới.
Phiên bản mới của ChatGPT có khả năng phân tích khuôn mặt, sao chép giọng điệu của con người và tiến hành các cuộc trò chuyện gần như thời gian thực, các nhà phát triển tiết lộ.
OpenAI đã trình bày phiên bản sắp tới của chatbot trí tuệ nhân tạo (AI), được gọi là GPT-4o, trong một bài thuyết trình theo thời gian thực. Chatbot, nói với người thuyết trình qua điện thoại, dường như có một yêu cầu kỳ lạ về cuộc trò chuyện của con người và các biểu hiện cảm xúc tinh tế của nó – chuyển đổi giữa giọng nói của robot và giọng hát theo yêu cầu, thích ứng với các đoạn và xử lý trực quan các khuôn mặt và môi trường xung quanh.
Trong buổi biểu diễn, trợ lý giọng nói trí tuệ nhân tạo đã thể hiện khả năng của mình bằng cách hoàn thành nhiều nhiệm vụ như dịch ngôn ngữ trong thời gian thực, giải các phương trình toán học viết trên tờ giấy và hướng dẫn người mù đi qua đường phố London.
Sam Altman, Giám đốc điều hành của OpenAI, đã viết một bài đăng trên mạng xã hội X sau khi buổi thuyết trình kết thúc. Bài viết liên quan đến bộ phim cùng tên năm 2013, trong đó một người đàn ông cô đơn phải lòng một trợ lý trí tuệ nhân tạo.
Để thể hiện khả năng đọc tín hiệu thị giác, trợ lý trí tuệ nhân tạo đã sử dụng camera trên điện thoại để nhìn vào khuôn mặt của một kỹ sư OpenAI và mô tả cảm xúc của họ.
Những khả năng mới này đánh dấu một bước tiến lớn so với các tính năng giọng nói hạn chế trong các phiên bản trước đó— chúng không có khả năng xử lý các gián đoạn hoặc đáp ứng thông tin hình ảnh.
Mira Murati, giám đốc công nghệ của OpenAI, nói trong một cuộc họp báo: “Chúng tôi đang hướng tới tương lai của tương tác giữa con người và máy móc. Chúng tôi tin rằng GPT-4o thực sự đang thay đổi cách tiếp cận đó'.
Dự kiến trợ lý giọng nói mới sẽ được phát hành dưới dạng giới hạn cho các người thử nghiệm alpha trong những tuần sắp tới, sau đó sẽ mở rộng ra toàn cầu thông qua việc trả phí cho các đăng ký ChatGPT Plus.
Thông báo này đến sau báo cáo từ Bloomberg về việc công ty sắp đạt thỏa thuận với Apple để tích hợp ChatGPT trên iPhone - mở ra cơ hội GPT-4o có thể được sử dụng để nâng cấp Siri, trợ lý giọng nói trên iPhone.
Tuy nhiên, công nghệ mới cũng gây ra những lo ngại về an toàn và nguy cơ từ các cuộc gọi điện thoại lừa đảo.