Amazon Nâng Cấp Alexa Cho Kỷ Nguyên ChatGPT

Khi Amazon giới thiệu trợ lý ảo Alexa cách đây chín năm, khả năng giải mã các lệnh giọng nói để đặt hẹn giờ hoặc phát nhạc dường như là một điều kỳ diệu. Ngày nay, độ ấn tượng về kỹ năng ngôn ngữ đã cao hơn rất nhiều, nhờ vào ChatGPT của OpenAI. Amazon đang đưa ra bản nâng cấp cho trợ lý giọng nói của mình, tận dụng công nghệ đằng sau làn sóng mới của các chatbot có khả năng tham gia vào cuộc trò chuyện rất giống với cuộc trò chuyện thực tế.
Amazon công bố bản nâng cấp cho Alexa tại một sự kiện tại trụ sở thứ hai của mình tại Arlington, Virginia. Trợ lý sẽ trả lời những câu hỏi phức tạp hơn và tham gia vào cuộc trò chuyện mở rộng hơn, loại bỏ nhu cầu phải nói “Alexa...” ở mỗi lượt.
Trong vài tuần tới, người dùng nói: “Alexa, hãy trò chuyện,” sẽ có quyền truy cập vào trợ lý giọng nói mới, mạnh mẽ hơn. Amazon gọi đó là một “phiên bản xem trước sớm” vì các khả năng mới vẫn đang trong quá trình phát triển.
Trình diễn trực tiếp vào ngày thứ Tư đã cho thấy Alexa thể hiện thêm tính cách mô phỏng với cách ngôn ngữ và cố gắng làm hài hước. Video cho thấy người ta yêu cầu Alexa viết thơ về một chủ đề, nảy ra ý tưởng cho một đêm hẹn, và tạo ra một câu chuyện về Jell-O. Thiết bị có trang bị camera như Echo Show sẽ cố gắng phát hiện khi người ta mong đợi Alexa tiếp tục cuộc trò chuyện và khi cuộc trò chuyện kết thúc.
Phiên bản mới của Alexa cũng sẽ điều chỉnh giọng nói của mình để tạo ra một cuộc đối thoại trở nên tự nhiên hơn. “Nếu tôi hỏi Alexa Red Sox đang làm gì, và họ vừa mới thua, nó sẽ trả lời với một tông điệu đồng cảm,” nói Rohit Prasad, người đứng đầu phát triển trí tuệ nhân tạo tại Amazon và đặt ở Cambridge, Massachusetts.
Prasad nói rằng việc nâng cấp kỹ năng ngôn ngữ của Alexa đòi hỏi sự kỹ thuật một cách toàn diện, vì các mô hình ngôn ngữ lớn có thể tạo ra thông tin, nói nhảm, và thậm chí là không thích hợp. “Đặc biệt là với một số hạn chế của mô hình ngôn ngữ, đây là một bước nhảy lớn,” Prasad nói.
Justine Cassell, giáo sư tại Đại học Carnegie Mellon nghiên cứu cách con người tương tác với các đại lý trí tuệ nhân tạo, cho biết sẽ thú vị để xem làm thế nào người ta phản ứng với một chatbot có khả năng đưa ra phản hồi phong phú. “Những mục tiêu là tuyệt vời, và tôi háo hức xem họ sẽ làm gì,” cô nói.
Tuy nhiên, Cassell cho biết một số điều mà Amazon đang hứa, như phản ứng với ngôn ngữ cơ thể, vẫn là một thách thức cực kỳ khó khăn. “Không có ngữ pháp của ngôn ngữ cơ thể, như cách có ngữ pháp cho ngôn ngữ nói và viết,” cô nói. Nếu Alexa đọc sai tư thế hoặc chuyển động của ai đó và phản ứng sai, mọi thứ có thể trở nên ng awkward. Cassell nói rằng ngay cả khi Alexa có thêm sự trôi chảy giống ChatGPT, những nỗ lực để bắt chước tính cách và cảm xúc của con người thông qua các đặc điểm như ngữ điệu có lẽ sẽ không khớp với khả năng của con người trong một khoảng thời gian ngắn. Hãy mong đợi Alexa mới đôi khi cảm thấy cứng nhắc trong cách phản ứng của mình.
Amazon cho biết người dùng sẽ có thể đăng ký để truy cập vào một bài kiểm tra bổ sung về công nghệ mới của nó, nơi khả năng mới của Alexa có thể được sử dụng để điều khiển các thiết bị khác, bao gồm cả một số thiết bị không được sản xuất bởi Amazon. Trong thời gian, công ty dự định thêm các tính năng mới cho Alexa, có thể bao gồm khả năng thảo luận và đề xuất sản phẩm từ kho hàng lớn của công ty.
Nếu Alexa có thể phản ứng với các truy vấn phức tạp hơn mà tránh được những lỗi ngượng ngùng, điều này có thể mở đầu cho một sự nâng cấp rộng lớn và cần thiết trong khả năng của trợ lý giọng nói.
Khi Amazon ra mắt Alexa vào năm 2014, nó đã giúp tạo ra một danh mục mới trong máy tính cá nhân xây dựng xung quanh tương tác giọng nói, kích thích những dự đoán rằng giao diện giọng nói sẽ sớm chiếm ưu thế. Alexa và Siri của Apple đã hưởng lợi từ những tiến bộ trong học máy cuối cùng đã làm cho thiết bị có thể nhận diện và phản ứng đáng tin cậy với giọng nói của người dùng. Nhưng sự phức tạp của ngôn ngữ đã giới hạn những thiết bị này chỉ đến các lệnh đơn giản và làm cho chúng không thể tham gia vào bất kỳ cuộc trò chuyện thực sự nào. Tuy nhiên, Amazon cho biết hơn nửa tỷ thiết bị tích hợp Alexa đã được bán trên toàn thế giới.
Sự xuất hiện của các mô hình ngôn ngữ lớn được đào tạo trên lượng lớn văn bản đã cuối cùng tạo ra các thuật toán có thể xử lý đối thoại phức tạp hơn. ChatGPT và các chatbot khác đã làm kinh ngạc cả chuyên gia và công chúng bằng tính linh hoạt và hùng hồn của chúng, mặc dù chúng có thể phát ra các tuyên bố có thể là sai lệch, có độ chệch, hoặc thậm chí là xúc phạm.
Prasad cho biết Amazon đã phát triển một mô hình ngôn ngữ lớn mới hiện đại để làm sống lại Alexa. Anh ta nói rằng công ty đã điều chỉnh mô hình này về các cách diễn đạt phù hợp cho cuộc trò chuyện bằng giọng, và nó sử dụng các thuật toán bổ sung để hỗ trợ việc nhận biết ngôn ngữ cơ thể và ngữ điệu.
Một trong những thách thức lớn đối với Amazon có thể chứng minh là xử lý các lỗi đáng ngạc nhiên đi kèm khi sử dụng các mô hình ngôn ngữ lớn. Khi Microsoft thêm một chatbot AI tiên tiến vào công cụ tìm kiếm Bing của mình, người dùng nhanh chóng phát hiện ra một số hành vi kỳ cục. “Nó có hoàn hảo 100% không? Không,” Prasad nói. “Đó là lý do nó là một bản xem trước sớm, vì sẽ có một số lỗi đôi khi.”
Prasad nói rằng Amazon đã phát triển rào cản để ngăn Alexa lạc hướng. Anh ta thêm rằng một số sẽ nhắc nhở người ta rằng họ đang nói chuyện với một máy, và cố gắng tránh việc trợ lý tỏ ra giống như một người quá mức. Một số người dùng chatbot thậm chí hình thành mối quan hệ tình cảm mạnh mẽ và thậm chí là lãng mạn với các tính cách mô phỏng mà họ tương tác. Prasad thêm rằng Amazon đang nghiên cứu về những rủi ro lâu dài có thể xuất phát từ sự tiến bộ của trí tuệ nhân tạo.
