Microsoft đang phát triển một máy có khả năng nhận biết giọng nói trong cuộc trò chuyện không thua kém con người

Buzz

Các câu hỏi thường gặp

1.

Máy móc đã vượt qua con người trong những lĩnh vực nào?

Máy móc đã vượt qua con người trong nhiều lĩnh vực như chơi cờ, tham gia game show truyền hình, nhận diện vật thể, nhận diện khuôn mặt, và chơi game máy tính.
2.

Tại sao việc nhận diện giọng nói vẫn là thách thức lớn đối với máy móc?

Việc nhận diện giọng nói là thách thức lớn vì máy móc phải xử lý nhiều yếu tố như tiếng ồn, sự đa dạng từ vựng và các âm thanh kênh phụ như 'uh' và 'uh-huh'.
3.

Microsoft đã đạt được kết quả gì trong việc nhận diện giọng nói?

Microsoft đã đạt được kết quả nhận diện giọng nói với tỉ lệ lỗi tương đương con người, đạt 5,9% trong các đoạn hội thoại chủ đề cụ thể và 11,1% trong các đoạn hội thoại giữa bạn bè.
4.

Điều gì giúp Microsoft đạt được hiệu suất nhận diện giọng nói ngang ngửa con người?

Microsoft tối ưu hóa các hệ thống học sâu và sử dụng bộ dữ liệu huấn luyện để dạy máy nhận diện các đoạn hội thoại thông thường, dẫn đến tỉ lệ lỗi tương đương con người.
5.

Lỗi phổ biến nhất của hệ thống nhận diện giọng nói của Microsoft là gì?

Lỗi phổ biến nhất là nhầm lẫn các âm thanh kênh phụ như 'uh' và 'uh-huh', trong khi con người hiếm khi gặp phải lỗi này.