TPO - OpenAI tiết lộ rằng ChatGPT đã được nâng cấp để trở nên giống con người hơn bao giờ hết. Phiên bản mới nhất của ChatGPT về trợ lý giọng nói hiện có khả năng phản ứng với âm thanh, văn bản và hình ảnh trong thời gian thực.

Màn hình điện thoại hiển thị GPT-4o
ChatGPT -4o sẽ được đưa ra thử nghiệm cho một số người trong vài tuần tới.
Phiên bản mới của ChatGPT có thể phân biệt biểu hiện khuôn mặt, mô phỏng giọng nói con người và thực hiện các cuộc trò chuyện gần như thời gian thực, như những người tạo ra nó tiết lộ.
OpenAI đã trình diễn phiên bản sắp tới của trợ lý trí tuệ nhân tạo (AI), được gọi là GPT-4o, trong một bài thuyết trình theo thời gian thực. Trợ lý ảo, đang nói với người thuyết trình qua điện thoại, dường như có một khả năng đặc biệt về cuộc trò chuyện của con người và các dấu hiệu cảm xúc tinh tế của nó – chuyển đổi giữa giọng nói của robot và giọng nói theo lệnh, thích nghi với các khúc mắc và xử lý môi trường xung quanh một cách trực quan.
Trong buổi trình diễn, trợ lý giọng nói AI đã thể hiện khả năng của mình bằng cách hoàn thành các nhiệm vụ như dịch ngôn ngữ theo thời gian thực, giải phương trình toán học trên một tờ giấy và hướng dẫn người mù đi dạo quanh phố London.
Sam Altman, CEO của OpenAI, đã viết trên mạng xã hội X sau khi kết thúc bài thuyết trình, liên quan đến bộ phim cùng tên năm 2013, trong đó một người đàn ông cô đơn phải lòng một trợ lý trí tuệ nhân tạo.
Để thể hiện khả năng đọc tín hiệu thị giác, chatbot đã dùng camera điện thoại để quan sát kỹ sư OpenAI và mô tả cảm xúc của họ.
Các khả năng mới này là một bước tiến lớn so với các tính năng giọng nói hạn chế trước đây— không có khả năng xử lý gián đoạn hoặc phản hồi thông tin hình ảnh.
Mira Murati, CTO của OpenAI, tại cuộc họp báo nói: 'Chúng tôi hướng tới tương lai của tương tác giữa con người và máy móc. GPT-4o đang thay đổi mô hình đó'
Trợ lý giọng nói mới dự kiến sẽ ra mắt dưới dạng giới hạn cho người thử alpha trong những tuần tới, sau đó sẽ được triển khai rộng rãi bắt đầu với việc trả tiền cho người dùng đăng ký ChatGPT Plus.
Thông báo này theo sau báo cáo của Bloomberg về việc OpenAI sắp đạt thỏa thuận với Apple để tích hợp ChatGPT vào iPhone - mở ra khả năng GPT-4o có thể được sử dụng để nâng cấp Siri, trợ lý giọng nói của iPhone.
Tuy nhiên, công nghệ mới cũng đem lại những lo ngại về an toàn và việc thực hiện các cuộc gọi lừa đảo.
