
Khi một robot gọi điện thoại của bạn, bạn thường có thể biết ngay lập tức. Giọng của nó êm dịu, hiếm khi bị trượt chân, và nó hoạt động không tự nhiên. Giọng nó tiết lộ nguồn gốc trước khi nó có cơ hội nói cho bạn biết rằng bạn đủ điều kiện để được vay tiền miễn phí, thanh toán thế chấp của bạn đã quá hạn, hoặc ý kiến của bạn thực sự quan trọng cho một cuộc khảo sát khách hàng. Việc biết rằng đó là một robot cũng làm cho việc treo máy dễ dàng hơn.
Những tâm hồn đằng sau Google Duplex đang trong quá trình thay đổi cái kiểu mẫu đó, có thể tốt hoặc xấu. Được công bố vào thứ Ba tại Google I/O, hội nghị phát triển hàng năm của công ty, Duplex là công nghệ mới cho phép trợ lý ảo được trang bị sức mạnh máy móc của Google thực hiện cuộc trò chuyện tự nhiên với con người qua điện thoại, mô phỏng sự nói chuyện nhẹ nhàng của tiếng nói con người khi hoàn thành các nhiệm vụ thực tế đơn giản.
Nó được trình bày trong sự kiện chính, và mặc dù buổi demo trực tiếp trên sân khấu đã được ghi trước, việc thấy và nghe khái niệm này hoạt động đã khiến khán giả ngạc nhiên. Trong buổi demo đầu tiên, một phụ nữ gọi điện thoại đến một tiệm làm tóc, nơi một phụ nữ khác nhấc máy; cả hai chị em trò chuyện khoảng một phút trước khi họ tìm ra một thời điểm phù hợp cho một cuộc hẹn làm tóc. Trong buổi demo thứ hai, cũng khoảng một phút, một người đàn ông gọi điện thoại đến một nhà hàng để đặt bàn; người phụ nữ ở phía nhận cuộc gọi có một giọng địa phương nặng và không cung cấp thông tin tốt nhất, vì vậy người gọi quyết định đưa ra yêu cầu mới.
Bí Mật Lớn Là Cả Hai Giọng Nói Khởi Xướng Cuộc Gọi Đều Không Thuộc Về Người. Chúng là bot, được gửi qua Google Assistant và kích hoạt thông qua một hệ thống backend. Nhưng chúng nghe có vẻ giống như con người: Chúng nói "Ừ" và "Ồ, tôi hiểu rồi" và kết thúc câu trả lời bằng giọng nâng của dấu hỏi. Và, với mục đích của buổi demo, chúng hoàn thành các công việc thường thuộc về chúng ta, những con người bình thường, cho dù đó có nghĩa là đặt hẹn làm tóc hoặc xác định liệu có nên chỉ đơn giản đi vào một nhà hàng và đánh cược vào một bàn.
Đối Với Google, Duplex đánh dấu bước tiến lớn tiếp theo trong cuộc trò chuyện robot tự nhiên, hoàn toàn tự động. Đối với chúng ta, nó điều này ở giữa sự thuận tiện lớn và sự lừa dối rùng rợn. Google vẫn chưa tung ra tính năng này, sẽ hoạt động trong Assistant trên điện thoại và loa thông minh tương thích. Công ty dự định bắt đầu thử nghiệm Duplex công khai vào mùa hè này. Trong thời gian chờ đợi, có ít nhất một số tính năng cần xem xét, bao gồm cách Assistant sẽ thông báo với những người không ngờ trên đầu kia.
Ông Robot Gọi Điện
Duplex được ra mắt lần đầu như một cuộc thử nghiệm vài năm trước, Google nói, và được bắt đầu bởi kỹ sư chính Yaniv Leviathan và Phó chủ tịch kỹ thuật Yossi Matias. (Một người trong công ty cho biết nó bắt đầu như một dự án 20 phần trăm, mặc dù một người phát ngôn của Google từ chối cho biết liệu nó có nằm trong các tham số đó hay không.) Duplex kết hợp xử lý ngôn ngữ tự nhiên, học sâu và công nghệ chuyển văn bản thành tiếng thành một dịch vụ duy nhất. Phần quan trọng nhất, tuy nhiên, là phần "tự nhiên" - các kỹ sư đã huấn luyện mô hình Duplex để phù hợp với mong đợi về độ trễ, như sự tạm dừng sau khi ai đó nói "Alô?", và để thay đổi ngữ điệu tùy thuộc vào cách cuộc trò chuyện diễn ra. Nói cách khác, để phản ứng như con người khi nói chuyện qua điện thoại.

Đây là một sự đảo ngược của động lực bot quen thuộc khi một con người gọi điện đến một nhà cung cấp, như một ngân hàng, và phải đối mặt với một máy tính ở phía đối diện.
“Thường khi mọi người nói chuyện với một máy tính, họ có một mục tiêu và họ thực sự sẵn lòng làm theo cách của máy tính,” nói Alexander Rudnicky, người nghiên cứu tương tác giọng nói giữa con người và máy tính tại Đại học Carnegie Mellon. “Theo cách này, nó đang làm ngược lại. Đó là một máy tính ra ngoài và cố gắng thuyết phục một con người rằng họ nên thử nói chuyện với nó.”
“Công nghệ này là đáng kinh ngạc,” nói John Havens, giám đốc điều hành của Chiến dịch Quy mô Toàn cầu về Đạo đức của Hệ thống Tự động và Thông minh của IEEE. “Nhưng tôi đã cho xem [video demo] với vợ tôi và cô ấy nói, ‘Cái nào là thật?’ Và đó là nơi nó gây rắc rối.”
Một trong những điều rõ ràng thiếu sót từ buổi demo Google I/O là bất kỳ thông báo nào từ phía Google Assistant rằng đó, thực sự, là một trợ lý ảo và không phải là một con người. Cuộc gọi điện từ Duplex sẽ xuất phát từ hệ thống backend của Google, không phải từ số điện thoại của bạn, có thể đã được lưu trong một số doanh nghiệp hoặc dịch vụ nơi bạn là khách hàng thường xuyên. Và đó là nơi mà vấn đề nảy sinh, Rudnicky nói. “Nó nên nói, ‘Đây là Google Assistant của so-and-so,' hoặc một cái gì đó khác mà rõ ràng xác định nó là một máy móc, trợ lý, hoặc con người,” ông nói.
Google không ngần ngại trả lời những câu hỏi của Mytour về cách thông báo này sẽ hoạt động, nhưng cho biết với CNET rằng Assistant sẽ "khả năng nói với người ở phía bên kia đường dây rằng anh ấy hoặc cô ấy đang nói chuyện với một trợ lý cá nhân kỹ thuật số." Nó không cung cấp chi tiết về cách chính xác mà điều đó sẽ xảy ra.
Phép Lịch Sự Điện Thoại
Khi gặp phải cuộc gọi điện thoại của bot, không chỉ là vấn đề về đạo đức mà còn về phép lịch sự. Một bản ghi của cuộc gọi được tạo ra bởi Google Assistant sẽ không có sẵn cho bạn, con người, sau khi nó được thực hiện, vì vậy không có cách nào để biết xem cuộc gọi tự động có vấp phải vấn đề gì đó không. (Có lẽ trở nên rõ ràng khi tiệm làm tóc hoặc nhà hàng yêu thích của bạn đột ngột đưa bạn vào danh sách đen.)
Và điều gì sẽ xảy ra nếu con người bắt đầu gửi những cuộc gọi khó chịu nhất của họ cho Google Assistant? Hiện tại, Google nói rằng nó giới hạn công nghệ Duplex cho các lĩnh vực rất cụ thể, nhưng Havens nhìn thấy tiềm năng mở rộng những giới hạn đó. “Khá sớm, không khó cho ai đó nhập vào các từ để có một trợ lý ảo chia tay với bạn trai của họ,” ông nói. “Hoặc, ‘gọi điện cho mẹ già của tôi vào cuối tuần này.’ Tôi nói hơi phóng đại một chút, nhưng thực sự chúng ta ở đây.”
Bất kỳ hệ thống cuộc gọi tự động nào đều có thể dễ bị lạm dụng. Dễ tưởng tượng một ai đó cố gắng lập trình Assistant để gọi làm phiền một doanh nghiệp, ví dụ. Google nói rằng nó đang đảm bảo rằng một người dùng đơn lẻ sẽ không thể thực hiện hơn một số lượng cuộc gọi cụ thể mỗi ngày, cũng như họ sẽ không được phép thực hiện nhiều cuộc gọi đến cùng một doanh nghiệp, tuy công ty từ chối tiết lộ giới hạn cuộc gọi là gì. Nó cũng nói rằng nó đang "xem xét các mô hình" để phát hiện bất kỳ điều gì có vẻ như là quảng cáo không mong muốn.
Rõ ràng vẫn còn rất nhiều câu hỏi chưa được trả lời về Duplex và cách nó sẽ hoạt động, những câu hỏi mà ngay cả trợ lý ảo tinh tế nhất cũng chưa thể trả lời. Nhưng Rudnicky chỉ ra rằng những hệ thống như vậy đã được phát triển trong hơn một thập kỷ trong các lĩnh vực như chăm sóc sức khỏe và có những lợi ích trong việc tùy chỉnh tức thì từ trí tuệ nhân tạo. "[Nó] có thể tương tác rộng rãi hơn với người đó," ông nói.
Rudnicky cũng nói rằng, nói chung, công nghệ như thế này là điều mà mọi người sẽ chỉ càng nhận biết rõ hơn. Ông trích dẫn một câu chuyện kể về khi máy ATM lần đầu tiên được giới thiệu và ông quan sát một người nói chuyện với nó như là một sự thay thế cho một người giao dịch ngân hàng.
“Nếu bạn vẫn chưa biết cách nó hoạt động, bạn phản ứng với nó theo cách bạn đã quen thuộc, như là một người,” ông nói. “Nhưng tôi đảm bảo bạn cùng một người ngày nay sẽ không gặp vấn đề gì khi giao dịch với một máy ATM. Chúng ta chỉ làm phổ biến tương tác này vào văn hóa của chúng ta. Và tôi nghĩ điều tương tự sẽ xảy ra với những thứ này.”
Thông Tin AI Nổi Bật
Khám phá độc quyền về Google Lens, phần mềm máy ảnh được trang bị trí tuệ nhân tạo của công ty.
Các tính năng mới của Google giúp cuộc sống trở nên dễ dàng hơn—và chúng hỗ trợ công ty thu thập nhiều dữ liệu hơn về người dùng của mình.
Thiếu sót sự kiện lớn? Dưới đây là tất cả những gì Google công bố tại I/O 2018.
Những hậu quả đáng ngạc nhiên của việc làm cho trí tuệ nhân tạo nghe có vẻ giống con người hơn.
