Giọng của hiện đã rất giống giọng người thật

Buzz

Ngày cập nhật gần nhất: 15/6/2026

Nội dung bài viết

TPO - OpenAI đã bắt đầu triển khai chế độ giọng nói tiên tiến của từ ngày 30/7 (theo giờ Mỹ), cho phép người dùng truy cập vào các phản hồi âm thanh thực sự giống hệt giọng người thật của GPT- lần đầu tiên. Phiên bản mới có thể nhận ra cảm xúc trong giọng nói của người dùng, từ sự buồn bã, hưng phấn và cả việc hát.

Xem thêm

Đọc tóm tắt

- OpenAI triển khai chế độ giọng nói tiên tiến của GPT- từ ngày 30/7, cho phép người dùng truy cập vào phản hồi âm thanh giống giọng người thật.
- Phiên bản mới có khả năng nhận ra cảm xúc trong giọng nói của người dùng, từ buồn bã đến hưng phấn và cả việc hát.
- Scarlett Johansson từ chối cho OpenAI sử dụng giọng của mình, dẫn đến loại bỏ giọng nói Sky từ bản demo.
- OpenAI trì hoãn việc phát hành chế độ giọng nói nâng cao để tăng cường an toàn, nhưng sẽ ra mắt tính năng video và chia sẻ màn hình trong bản cập nhật Mùa xuân.

TPO - OpenAI đã bắt đầu triển khai chế độ giọng nói tiên tiến của từ ngày 30/7 (theo giờ Mỹ), cho phép người dùng truy cập vào các phản hồi âm thanh thực sự giống hệt giọng người thật của GPT- lần đầu tiên. Phiên bản mới có thể nhận ra cảm xúc trong giọng nói của người dùng, từ sự buồn bã, hưng phấn và cả việc hát.

Phiên bản alpha dành cho một nhóm nhỏ người dùng Plus (trả phí), và OpenAI cho biết tính năng này sẽ dần dần triển khai cho tất cả người dùng Plus vào mùa thu năm 2024.

Khi OpenAI giới thiệu giọng nói của GPT- vào tháng Năm, tính năng này đã gây ấn tượng với khán giả với các phản hồi nhanh chóng và sự giống nhau đáng kinh ngạc với giọng nói của con người thực – một giọng đặc biệt. Giọng nói này, Sky, giống với giọng của minh tinh Scarlett Johansson.

Ngay sau khi OpenAI trình diễn, Johansson cho biết cô đã từ chối nhiều lời mời từ CEO Sam Altman để hãng sử dụng giọng của mình, và sau khi xem bản demo của GPT-, đã thuê luật sư để bảo vệ hình ảnh của mình.

Minh tinh Scarlett Johansson không cho phép OpenAI sử dụng giọng của cô. Ảnh: Today Show.

OpenAI đã phủ nhận việc sử dụng giọng của Johansson, nhưng sau đó đã loại bỏ giọng nói được trình diễn trong demo của mình. Vào tháng Sáu, OpenAI thông báo sẽ trì hoãn việc phát hành chế độ giọng nói nâng cao để tăng cường biện pháp an toàn.

Sau một tháng, OpenAI thông báo rằng tính năng video và chia sẻ màn hình sẽ sớm được ra mắt trong bản cập nhật Mùa xuân, không có trong phiên bản alpha ban đầu.

Hiện tại, bản demo GPT- vẫn đang ở giai đoạn thử nghiệm, nhưng một số người dùng cao cấp có thể truy cập vào tính năng giọng nói của .

Scarlett Johansson, nữ diễn viên người Mỹ. Ảnh: Vanity Fair.

hiện đã có khả năng nói và nghe

Người dùng có thể thử tính năng giọng nói hiện tại của , tuy nhiên tính năng giọng nói tiên tiến sẽ có sự khác biệt đáng kể.

Giải pháp âm thanh trước đây của bao gồm ba mô hình riêng biệt: Một mô hình chuyển đổi giọng nói người dùng thành văn bản, GPT-4 để xử lý yêu cầu của người dùng, và một mô hình thứ ba để chuyển đổi văn bản của thành giọng nói.

Tuy nhiên, GPT- là mô hình đa phương tiện, có khả năng xử lý các tác vụ này mà không cần sự hỗ trợ từ các mô hình phụ trợ, giúp giảm thiểu đáng kể độ trễ trong các cuộc trò chuyện.

OpenAI cũng tuyên bố GPT- có thể phát hiện được cảm xúc trong giọng nói của người dùng, bao gồm sự buồn rầu, hào hứng hoặc hưng phấn.

Người dùng Plus được trải nghiệm trực tiếp tính thực sự giống giọng người thật của chế độ giọng nói nâng cao.

OpenAI cho biết đã thử nghiệm khả năng giọng nói của GPT- với hơn 100 nhóm đánh giá độc lập bên ngoài, nói 45 ngôn ngữ khác nhau. Hình ảnh: OpenAI.

OpenAI thông báo đang tung ra một cách dần dần giọng nói mới của để theo dõi chặt chẽ việc sử dụng tính năng này. Những người trong nhóm alpha sẽ nhận được thông báo trong ứng dụng , sau đó là email hướng dẫn cách sử dụng.

Trong những tháng kể từ khi OpenAI giới thiệu, công ty cho biết đã thử nghiệm khả năng giọng nói của GPT- với hơn 100 nhóm đánh giá độc lập bên ngoài, nói 45 ngôn ngữ khác nhau. Một báo cáo về kết quả thử nghiệm sẽ được phát hành vào đầu tháng Tám.

Công ty cho biết chế độ giọng nói nâng cao sẽ bị giới hạn với bốn giọng nói mặc định của – Juniper, Breeze, Cove và Ember – được tạo ra với sự hợp tác của các diễn viên lồng tiếng trả phí.

Giọng nói Sky được giới thiệu trong bản demo tháng Năm của OpenAI không còn có sẵn trong . Người phát ngôn của OpenAI, Lindsay McCallum, nói: “ không thể bắt chước giọng nói của người khác, cả cá nhân và nhân vật công chúng, và sẽ chặn các đầu ra khác sử dụng một trong bốn giọng nói mặc định này”.

Một số thành viên trả phí của OpenAI đã có quyền truy cập vào chế độ giọng nói tiên tiến của từ ngày 30/7. Ảnh: Open AI.

OpenAI đang nỗ lực tránh các tranh cãi về deepfake . Vào tháng Giêng, công nghệ sao chép giọng nói của startup AI ElevenLabs đã được áp dụng để giả mạo giọng Tổng thống Mỹ Biden, lừa dối cử tri ở bang New Hampshire.

OpenAI đã công bố việc giới thiệu các bộ lọc mới để ngăn chặn các yêu cầu tạo ra âm nhạc hoặc âm thanh có bản quyền.

Trong năm qua, các công ty AI đã gặp phải các vấn đề pháp lý do vi phạm bản quyền, và các mô hình âm thanh như GPT- sẽ mở ra một giai đoạn mới mà các công ty hoàn toàn có thể nộp đơn khiếu nại, đặc biệt là các công ty thu âm – họ đã kiện các đơn vị tạo ra bài hát AI như Suno, Udio…

Các câu hỏi thường gặp

Chế độ giọng nói tiên tiến của OpenAI đã được triển khai từ khi nào?

Chế độ giọng nói tiên tiến của OpenAI đã được triển khai từ ngày 30/7 theo giờ Mỹ, cho phép người dùng truy cập vào phản hồi âm thanh giống hệt giọng người thật.

Liệu người dùng Plus có thể trải nghiệm giọng nói của GPT- trong thời gian thử nghiệm không?

Có, người dùng Plus có thể trải nghiệm giọng nói của GPT- trong thời gian thử nghiệm và tính năng này sẽ dần được mở rộng cho tất cả người dùng vào mùa thu năm 2024.

Tính năng giọng nói của GPT- có khả năng nhận diện cảm xúc không?

Có, tính năng giọng nói của GPT- có khả năng nhận diện cảm xúc trong giọng nói của người dùng, bao gồm các trạng thái như buồn bã, hào hứng và phấn khích.

Tại sao OpenAI lại phải loại bỏ giọng nói Sky trong chế độ giọng nói?

OpenAI đã phải loại bỏ giọng nói Sky do không có sự cho phép của Scarlett Johansson, người mà giọng nói này được cho là giống với giọng của cô. Điều này nhằm tránh các tranh cãi liên quan đến quyền sử dụng giọng nói.

Có bao nhiêu giọng nói mặc định sẽ được sử dụng trong chế độ giọng nói nâng cao của OpenAI?

Chế độ giọng nói nâng cao của OpenAI sẽ sử dụng bốn giọng nói mặc định là Juniper, Breeze, Cove và Ember, được tạo ra với sự hợp tác của các diễn viên lồng tiếng.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]