ChatGPT có khả năng phân tích khuôn mặt của đối tác được không?

Buzz

Đọc tóm tắt

- OpenAI đã cập nhật ChatGPT để trở nên giống con người hơn bao giờ hết.
- ChatGPT mới có khả năng phản hồi âm thanh, văn bản và hình ảnh trong thời gian thực.
- GPT-4o sẽ được triển khai cho người thử nghiệm.
- ChatGPT mới có khả năng phân tích khuôn mặt và sao chép giọng điệu con người.
- Sam Altman viết bài về trợ lý trí tuệ nhân tạo.
- Mira Murati nói về tương lai tương tác con người và máy móc.
- ChatGPT có thể tích hợp trên iPhone, nâng cấp Siri.
- Lo ngại về an toàn và nguy cơ từ cuộc gọi lừa đảo.

TPO - OpenAI tiết lộ rằng họ đã cập nhật ChatGPT để trở nên giống con người hơn bao giờ hết. Phiên bản mới nhất của ChatGPT về trợ lý giọng nói hiện có thể phản hồi các đầu vào âm thanh, văn bản và hình ảnh trong thời gian thực.

Màn hình điện thoại hiển thị GPT-4o

ChatGPT-4o sẽ được triển khai cho những người thử nghiệm trong vài tuần tới.

Phiên bản mới của ChatGPT có khả năng phân tích khuôn mặt, sao chép giọng điệu của con người và tiến hành các cuộc trò chuyện gần như thời gian thực, các nhà phát triển tiết lộ.

OpenAI đã trình bày phiên bản sắp tới của chatbot trí tuệ nhân tạo (AI), được gọi là GPT-4o, trong một bài thuyết trình theo thời gian thực. Chatbot, nói với người thuyết trình qua điện thoại, dường như có một yêu cầu kỳ lạ về cuộc trò chuyện của con người và các biểu hiện cảm xúc tinh tế của nó – chuyển đổi giữa giọng nói của robot và giọng hát theo yêu cầu, thích ứng với các đoạn và xử lý trực quan các khuôn mặt và môi trường xung quanh.

Trong buổi biểu diễn, trợ lý giọng nói trí tuệ nhân tạo đã thể hiện khả năng của mình bằng cách hoàn thành nhiều nhiệm vụ như dịch ngôn ngữ trong thời gian thực, giải các phương trình toán học viết trên tờ giấy và hướng dẫn người mù đi qua đường phố London.

Sam Altman, Giám đốc điều hành của OpenAI, đã viết một bài đăng trên mạng xã hội X sau khi buổi thuyết trình kết thúc. Bài viết liên quan đến bộ phim cùng tên năm 2013, trong đó một người đàn ông cô đơn phải lòng một trợ lý trí tuệ nhân tạo.

Để thể hiện khả năng đọc tín hiệu thị giác, trợ lý trí tuệ nhân tạo đã sử dụng camera trên điện thoại để nhìn vào khuôn mặt của một kỹ sư OpenAI và mô tả cảm xúc của họ.

Những khả năng mới này đánh dấu một bước tiến lớn so với các tính năng giọng nói hạn chế trong các phiên bản trước đó— chúng không có khả năng xử lý các gián đoạn hoặc đáp ứng thông tin hình ảnh.

Mira Murati, giám đốc công nghệ của OpenAI, nói trong một cuộc họp báo: “Chúng tôi đang hướng tới tương lai của tương tác giữa con người và máy móc. Chúng tôi tin rằng GPT-4o thực sự đang thay đổi cách tiếp cận đó'.

Dự kiến trợ lý giọng nói mới sẽ được phát hành dưới dạng giới hạn cho các người thử nghiệm alpha trong những tuần sắp tới, sau đó sẽ mở rộng ra toàn cầu thông qua việc trả phí cho các đăng ký ChatGPT Plus.

Thông báo này đến sau báo cáo từ Bloomberg về việc công ty sắp đạt thỏa thuận với Apple để tích hợp ChatGPT trên iPhone - mở ra cơ hội GPT-4o có thể được sử dụng để nâng cấp Siri, trợ lý giọng nói trên iPhone.

Tuy nhiên, công nghệ mới cũng gây ra những lo ngại về an toàn và nguy cơ từ các cuộc gọi điện thoại lừa đảo.

Các câu hỏi thường gặp

Phiên bản mới nhất có những khả năng gì đặc biệt?

Phiên bản mới nhất, GPT-, có khả năng phản hồi đầu vào âm thanh, văn bản và hình ảnh trong thời gian thực, cũng như phân tích khuôn mặt và sao chép giọng điệu của con người.

Có phải GPT- có thể thực hiện các cuộc trò chuyện gần như thời gian thực không?

Có, GPT- có khả năng thực hiện các cuộc trò chuyện gần như thời gian thực, chuyển đổi giữa giọng nói của robot và giọng hát, thích ứng với các đoạn văn và xử lý trực quan môi trường xung quanh.

có thể hỗ trợ trong các nhiệm vụ nào trong thời gian thực?

có thể hỗ trợ dịch ngôn ngữ trong thời gian thực, giải các phương trình toán học, và hướng dẫn người mù đi qua các đường phố, thể hiện khả năng tương tác đa dạng với người dùng.

Tương lai của tương tác giữa con người và máy móc sẽ thay đổi như thế nào với GPT-?

Tương lai của tương tác giữa con người và máy móc được kỳ vọng sẽ thay đổi mạnh mẽ nhờ GPT-, mở ra các phương thức giao tiếp mới và nâng cao trải nghiệm người dùng.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua email: [email protected]