
Tôi không phải là một đầu bếp giỏi, nhưng những lần tôi đã yêu cầu Trợ Lý Google trên Nest Mini của mình đặt đồng hồ báo thức trong nhà bếp đã có lúc thành công, lúc thất bại. Quá thường xuyên, đồng hồ báo thức biến mất vào một vùng trống và Google không thể cho tôi biết còn bao nhiêu phút nữa. Cũng có lúc, tôi phải cố gắng đặt nhiều lần vì Trợ Lý gặp khó khăn trong việc hiểu ngữ cảnh.
Những vấn đề đó (và một số vấn đề khác) sắp được giải quyết. Cập nhật mới nhất của Google cho trợ lý giọng nói của mình, bắt đầu được triển khai từ hôm nay, cải thiện đáng kể việc hiểu ngữ cảnh khi bạn yêu cầu nó thực hiện một nhiệm vụ như đặt báo thức hoặc đồng hồ báo thức. Trong cập nhật này còn có một sửa lỗi khác sẽ được chào đón bởi bất kỳ ai sử dụng lệnh bằng giọng nói để quản lý cuộc gọi và tin nhắn: Bạn cuối cùng cũng có thể dạy Trợ Lý cách phát âm đúng tên của bạn bè hoặc thành viên trong gia đình.
Ngữ Cảnh Là Chìa Khóa
Bạn cũng đã có thể điều khiển nhiều đồng hồ báo thức cùng một lúc với Trợ lý Google từ trước, nhưng nếu bạn muốn hủy bỏ một trong số chúng, điều đó yêu cầu một vài thao tác phiền phức. Trợ lý hiện giờ nhanh hơn rất nhiều trong việc xác định bạn muốn hủy bỏ đồng hồ báo thức nào. Và nếu bạn đặt tên cho mỗi đồng hồ, như “trứng đang luộc,” và sau đó bạn nói, “Hủy bỏ đồng hồ báo thức trứng của tôi,” Trợ lý cũ sẽ không hiểu bạn nói về điều gì, vì các tên không khớp. Cập nhật mới sửa lỗi điều đó.
Với đồng hồ báo thức, nếu trước đây bạn đã yêu cầu Trợ lý Google dời một đồng hồ báo thức đã được lên lịch một giờ sau, đôi khi nó hiểu lầm và đặt đồng hồ báo thức một giờ sau thời điểm yêu cầu của bạn. Bây giờ nó hiểu bạn đang tham chiếu đến một đồng hồ báo thức đã được lên lịch và sẽ điều chỉnh đúng đắn.
Nếu bạn đã từng gặp vấn đề khi giao tiếp với trợ lý giọng nói, có lẽ bạn đã thay đổi cụ thể của lệnh của mình giữa câu. “Hey Google, đặt báo thức trong 20—không, 10 phút.” Cho đến nay, Trợ lý có thể đã đặt tên cho đồng hồ báo thức 10 phút của bạn là “20, không.” Với cập nhật mới nhất, nó hiểu bạn đã mắc lỗi và bạn chỉ muốn có 10 phút trên đồng hồ.
Các chức năng báo thức và đồng hồ báo thức được cập nhật đã có sẵn trên các thiết bị Trợ lý không màn hình ngày hôm nay (như loa Nest) và sẽ được đưa đến điện thoại và màn hình thông minh vào một ngày sau.
Những cải tiến này đến từ việc thiết kế lại từ đầu của hệ thống Trợ lý sử dụng cho việc hiểu ngôn ngữ tự nhiên. Amarnag Subramanya, một kỹ sư ưu tú tại Google, người đứng đầu các nhóm NLU và Trí tuệ nhân tạo trò chuyện trên Trợ lý Google, cho biết điều này cho phép các cuộc trò chuyện giữa con người và các trợ lý không phải là con người của chúng ta diễn ra tự nhiên hơn nhiều.
“Hôm nay, khi mọi người muốn nói chuyện với bất kỳ trợ lý kỹ thuật số nào, họ đang nghĩ về hai điều: tôi muốn làm gì và tôi nên diễn đạt lệnh của mình như thế nào để làm được việc đó,” Subramanya nói. “Tôi nghĩ rằng điều đó rất không tự nhiên. Có một gánh nặng tư duy lớn khi mọi người nói chuyện với trợ lý kỹ thuật số; cuộc trò chuyện tự nhiên là một cách để giảm bớt gánh nặng tư duy đó đi.”
Làm cho cuộc trò chuyện với Trợ lý trở nên tự nhiên hơn có nghĩa là cải thiện khả năng giải quyết tham chiếu của nó - khả năng liên kết một cụm từ với một thực thể cụ thể. Ví dụ, nếu bạn nói, “Đặt báo thức trong 10 phút,” và sau đó nói, “Đổi thành 12 phút,” một trợ lý giọng nói cần phải hiểu và giải quyết cái bạn đang tham chiếu khi bạn nói “nó.”
Các mô hình NLU mới được cung cấp bởi công nghệ học máy, cụ thể là biểu diễn mã hóa song hướng từ các biến ánh xạ, hay còn gọi là BERT. Google đã giới thiệu kỹ thuật này vào năm 2018 và áp dụng nó đầu tiên cho Tìm kiếm Google. Công nghệ hiểu ngôn ngữ sớm trước đây sử dụng để phân tích từng từ trong một câu một cách riêng lẻ, nhưng BERT xử lý mối quan hệ giữa tất cả các từ trong cụm từ, cải thiện đáng kể khả năng nhận diện ngữ cảnh.
Một ví dụ về cách BERT cải thiện Tìm kiếm (như được tham chiếu ở đây) là khi bạn tìm kiếm “Đậu xe trên dốc không có vỉa hè.” Trước đây, kết quả vẫn chứa các dốc có vỉa hè. Sau khi BERT được kích hoạt, Google tìm kiếm đưa ra một trang web khuyến nghị cho tài xế để quay bánh xe về phía lề đường. Tuy nhiên, BERT không hoàn toàn không gặp vấn đề. Các nghiên cứu của các nhà nghiên cứu Google đã chỉ ra rằng mô hình này đã liên kết các cụm từ liên quan đến khuyết tật với ngôn ngữ tiêu cực, khiến cho công ty phải cẩn thận hơn với các dự án xử lý ngôn ngữ tự nhiên.

Nhưng với các mô hình BERT được áp dụng cho đồng hồ báo thức và báo thức, Subramanya cho biết Trợ lý bây giờ có khả năng phản hồi các truy vấn liên quan, như các điều chỉnh được nhắc đến trước đó, với độ chính xác gần như 100%. Nhưng hiểu biết ngữ cảnh vượt trội này vẫn chưa hoạt động ở mọi nơi - Google nói rằng họ đang từ từ mang các mô hình cập nhật này đến nhiều nhiệm vụ khác như nhắc nhở và điều khiển các thiết bị nhà thông minh.
William Wang, giám đốc nhóm Xử lý Ngôn ngữ Tự nhiên của Đại học California, Santa Barbara, cho biết những cải tiến của Google là một bước đột phá, đặc biệt khi áp dụng mô hình BERT vào việc hiểu ngôn ngữ nói là 'không phải điều dễ dàng.'
“Trong toàn bộ lĩnh vực xử lý ngôn ngữ tự nhiên, sau năm 2018, khi Google giới thiệu mô hình BERT này, mọi thứ đã thay đổi,” Wang nói. “BERT thực sự hiểu được những gì tiếp theo một cách tự nhiên từ câu này sang câu khác và mối quan hệ giữa các câu. Bạn đang học một biểu diễn ngữ cảnh của từ, cụm từ và cả các câu, so với công việc trước năm 2018, điều này mạnh mẽ hơn nhiều.”
Hầu hết những cải tiến này có thể bị giới hạn trong việc đặt báo thức và báo thức, nhưng bạn sẽ thấy một cải thiện tổng quát trong khả năng của trợ lý giọng nói để hiểu ngữ cảnh rộng lớn. Ví dụ, nếu bạn hỏi về thời tiết ở New York và tiếp theo đó là các câu hỏi như "Tòa nhà cao nhất ở đó là gì?" và "Ai đã xây dựng nó?" Trợ lý sẽ tiếp tục cung cấp câu trả lời biết bạn đang nói về thành phố nào. Điều này không hoàn toàn mới, nhưng cập nhật này khiến Trợ lý trở nên thông minh hơn trong việc giải quyết những câu đố ngữ cảnh này.
Dạy Tên Cho Trợ Lý
Trợ lý hiện giờ đã tốt hơn trong việc hiểu những tên riêng độc đáo. Nếu bạn đã cố gắng gọi điện hoặc gửi tin nhắn cho ai đó có tên không phổ biến, có khả năng cao bạn đã phải thử nhiều lần hoặc không hoạt động vì Trợ lý Google không nhận ra cách phát âm đúng.
May mắn thay, công nghệ mô hình giọng mới của Google giờ đây cho phép bạn đọc tên cho Trợ lý để nó có thể nhận dạng tốt hơn. Bạn chỉ cần thiết lập điều này thủ công trong cài đặt của Trợ lý trên điện thoại của bạn. Hơn nữa, bản ghi âm của bạn không được tải lên đám mây và gửi đến Google. “Chúng tôi có thể học các khía cạnh về cách phát âm mà không cần lưu trữ âm thanh,” Subramanya nói.
Khả năng nhận diện tên được cải thiện này chỉ có sẵn bằng tiếng Anh trên điện thoại Android, loa thông minh và màn hình thông minh. Google cho biết họ hy vọng sẽ mở rộng tính năng này sang các ngôn ngữ khác sớm.
Subramanya cho biết hành trình của Google để tạo ra cuộc trò chuyện với trợ lý giọng nói của mình tự nhiên hơn không khác gì việc cập nhật dần dần Google Search qua các năm. “Nếu bạn quay về những ngày đầu của Google Search, bạn phải nghĩ rất cụ thể về các truy vấn của mình. Bây giờ bạn chỉ cần nói ‘Quán cà phê gần đây.’ Bạn không cần phải suy nghĩ nhiều về tập từ bạn sử dụng. Chúng tôi đang thấy một tiến triển tương tự với các trợ lý kỹ thuật số,”
Nhưng đừng mong đợi có các cuộc trò chuyện dài, kéo dài với trí tuệ nhân tạo của bạn ngay lúc này. Wang nói rằng máy móc vẫn gặp khó khăn trong việc xử lý một số loại yêu cầu. Ví dụ, chúng vẫn chưa tốt lắm trong việc cung cấp câu trả lời học được từ hình ảnh, video hoặc các nguồn khác.
“Vẫn còn một quãng đường dài phía trước đối với máy móc để có thể nói chuyện với con người và thực sự hiểu một cách tự nhiên và có khả năng phản ứng tự nhiên,” ông nói.
Những câu chuyện tuyệt vời khác từ Mytour
- 📩 Tin tức mới nhất về công nghệ, khoa học và nhiều hơn nữa: Nhận bản tin của chúng tôi!
- Trận chiến lạnh về những chiếc máy kem của McDonald's bị hack
- Chuyện gì về giấc mơ của bạch tuộc cho chúng ta về sự tiến hóa của giấc ngủ
- Hướng dẫn cho người chơi game lười biếng về việc quản lý dây cáp
- Làm thế nào để đăng nhập vào thiết bị của bạn mà không cần mật khẩu
- Giúp đỡ! Tôi có tiết lộ quá nhiều với đồng nghiệp của mình không?
- 👁️ Khám phá Trí tuệ Nhân tạo như chưa bao giờ với cơ sở dữ liệu mới của chúng tôi
- 🎮 Mytour Games: Nhận các mẹo mới nhất, đánh giá và nhiều hơn nữa
- 🏃🏽♀️ Muốn có những công cụ tốt nhất để khỏe mạnh? Hãy xem lựa chọn của nhóm Gear của chúng tôi cho bộ theo dõi sức khỏe tốt nhất, trang thiết bị chạy bộ (bao gồm giày và tất), và tai nghe tốt nhất
