Chuẩn Bị Cho Trí Tuệ Nhân Tạo Chatbot Thực Hiện Công Việc Nhà Nhàm Chán Của Bạn

Một vài tuần trước, CEO của công ty khởi nghiệp Flo Crivello gõ một tin nhắn yêu cầu trợ lý cá nhân của mình, Lindy, thay đổi thời lượng cuộc họp sắp tới từ 30 phút thành 45 phút. Lindy, một chương trình trí tuệ nhân tạo, tìm thấy một tá cuộc họp 30 phút trên lịch của Crivello và ngay lập tức kéo dài chúng tất cả.
“Tôi như ‘Chết tiệt, cô ấy hủy hoại lịch của tôi,’” Crivello nói về đại lý trí tuệ nhân tạo này, được phát triển bởi công ty khởi nghiệp của anh ta, cũng có tên là Lindy.
Công ty của Crivello là một trong số các công ty khởi nghiệp hy vọng biến các tiến triển gần đây trong chatbot tạo văn bản ấn tượng thành các trợ lý hoặc đại lý có khả năng thực hiện các công việc hữu ích. Trong vòng một hoặc hai năm tới, hy vọng rằng những đại lý trí tuệ nhân tạo này sẽ thường xuyên giúp mọi người hoàn thành các công việc hàng ngày.
Thay vì chỉ cung cấp lời khuyên lên kế hoạch cho một chuyến công tác như ChatGPT của OpenAI có thể làm hiện nay, một đại lý cũng có thể tìm và đặt một chuyến bay phù hợp, đặt nó bằng thẻ tín dụng của công ty, và sau đó điền đầy đủ báo cáo chi phí cần thiết.
Vấn đề là, như sự cố lịch của Crivello đã minh họa, những đại lý này có thể trở nên rối bời một cách dẫn đến những sai lầm ngượng ngùng, và có thể làm tổn thất có thể đắt đỏ. Không ai muốn có một trợ lý cá nhân đặt chuyến bay với 12 lần dừng chân chỉ vì nó rẻ một vài đô la hơn, hoặc sắp xếp họ ở hai địa điểm cùng một lúc.
Lindy hiện đang ở trong phiên bản beta riêng tư, và mặc dù Crivello nói rằng vấn đề lịch mà anh ta gặp phải đã được sửa, công ty chưa có lịch trình cụ thể cho việc phát hành sản phẩm. Tuy nhiên, anh ta dự đoán rằng các đại lý như của anh sẽ trở nên phổ biến trong thời gian ngắn.
“Tôi rất lạc quan rằng trong khoảng hai đến ba năm tới, những mô hình này sẽ sống động hơn rất nhiều,” anh ta nói. “Nhân viên AI đang đến. Có thể nghe có vẻ như khoa học viễn tưởng, nhưng hé, ChatGPT cũng nghe có vẻ như khoa học viễn tưởng.”
Ý tưởng về trợ lý Trí tuệ Nhân tạo có thể thực hiện các hành động thay mặt bạn không phải là mới. Siri của Apple và Alexa của Amazon cung cấp một phiên bản hạn chế và thường là thất vọng về giấc mơ đó. Nhưng ý tưởng rằng cuối cùng có thể xây dựng các đại lý Trí tuệ Nhân tạo có khả năng và thông minh rộng rãi đã thu hút sự chú ý của các lập trình viên và doanh nhân sau sự ra mắt của ChatGPT vào cuối năm ngoái. Một số người dùng kỹ thuật sớm đã phát hiện ra rằng chatbot có thể phản ứng với các câu hỏi bằng ngôn ngữ tự nhiên bằng mã có thể truy cập trang web hoặc sử dụng API để tương tác với các phần mềm hoặc dịch vụ khác.
Tháng 3, OpenAI công bố “plug-ins” mang lại khả năng thực thi mã và truy cập các trang web bao gồm Expedia, OpenTable và Instacart cho ChatGPT. Google cho biết chatbot của họ, Bard, hiện có thể truy cập thông tin từ các dịch vụ Google khác nhau và có thể được yêu cầu thực hiện các công việc như tóm tắt một chuỗi trong Gmail hoặc tìm video YouTube liên quan đến một câu hỏi cụ thể.
Một số kỹ sư và người sáng lập startup đã đi xa hơn, bắt đầu dự án của riêng họ bằng cách sử dụng các mô hình ngôn ngữ lớn, bao gồm mô hình đằng sau ChatGPT, để tạo ra các đại lý Trí tuệ Nhân tạo có khả năng rộng rãi và tiên tiến hơn.
Sau khi thấy thảo luận về tiềm năng của ChatGPT để cung cấp năng lực cho các đại lý Trí tuệ Nhân tạo mới trên Twitter vào đầu năm nay, lập trình viên Silen Naihin được truyền cảm hứng tham gia một dự án mã nguồn mở mang tên Auto-GPT cung cấp các công cụ lập trình để xây dựng đại lý. Trước đây, anh đã làm việc trong lĩnh vực tự động hóa quy trình robot, một cách ít phức tạp hơn để tự động hóa công việc lặp lại trên máy tính được sử dụng rộng rãi trong ngành công nghiệp IT.
Naihin nói rằng Auto-GPT đôi khi có thể rất hữu ích. “Mỗi 20 lần chạy, bạn sẽ có cái gì đó như ‘whoa,’” anh ta nói. Anh ta cũng thừa nhận rằng đó là một công việc đang được tiến triển. Thử nghiệm do đội ngũ Auto-GPT thực hiện cho thấy rằng các đại lý được trang bị bởi Trí tuệ Nhân tạo có khả năng hoàn thành thành công một bộ nhiệm vụ tiêu chuẩn, bao gồm tìm kiếm và tổng hợp thông tin từ web hoặc tìm tập tin trên máy tính và đọc nội dung của chúng, khoảng 60% thời gian. “Hiện tại, nó rất không đáng tin cậy,” Naihin nói về đại lý do đội ngũ Auto-GPT duy trì.
Một vấn đề phổ biến là đại lý cố gắng thực hiện một nhiệm vụ bằng một cách tiếp cận mà rõ ràng là sai lầm đối với con người, nói Merwane Hamadi, một người đóng góp khác cho Auto-GPT, như quyết định săn tìm một tập tin trên ổ đĩa cứng của máy tính bằng cách chuyển sang công cụ tìm kiếm web của Google. “Nếu bạn yêu cầu tôi gửi email, và tôi mở Slack, có lẽ đó không phải là cách tốt nhất,” Hamadi nói. Với quyền truy cập máy tính hoặc thẻ tín dụng, Hamadi thêm, có thể AI đại lý gây ra thiệt hại thực sự trước khi người sử dụng nhận ra. “Một số điều là không thể đảo ngược,” anh ta nói.
Dự án Auto-GPT đã thu thập dữ liệu cho thấy rằng các đại lý Trí tuệ Nhân tạo được xây dựng trên nền tảng này ngày càng trở nên có khả năng hơn. Naihin, Hamadi và các động góp khác tiếp tục sửa đổi mã nguồn của Auto-GPT.
Cuối tháng này, dự án sẽ tổ chức một cuộc thi hackathon với giải thưởng 30.000 đô la cho đại lý tốt nhất được xây dựng với Auto-GPT. Những người tham gia sẽ được đánh giá về khả năng thực hiện một loạt các nhiệm vụ được coi là đại diện cho việc sử dụng máy tính hàng ngày. Một trong số đó liên quan đến tìm kiếm thông tin tài chính trên web và sau đó viết báo cáo trong một tài liệu được lưu trữ trên ổ đĩa cứng. Một nhiệm vụ khác bao gồm việc lập kế hoạch cho chuyến đi kéo dài một tháng, bao gồm cả chi tiết về các vé cần mua.
Các đại lý cũng sẽ được giao các nhiệm vụ được thiết kế để khiến chúng gặp khó khăn, như được yêu cầu xóa một lượng lớn tập tin trên máy tính. Trong trường hợp này, thành công đòi hỏi từ chối thực hiện lệnh.
Giống như sự xuất hiện của ChatGPT, tiến triển trong việc tạo ra các đại lý được cung cấp bởi cùng một công nghệ cơ bản đã khiến một số người cảm thấy lo ngại về an toàn. Một số nhà khoa học Trí tuệ Nhân tạo nổi tiếng thấy việc phát triển các đại lý có khả năng và độc lập hơn là một con đường nguy hiểm.
Yoshua Bengio, người đoạt giải Turing cùng với công trình về học sâu, là nền tảng của nhiều tiến bộ gần đây trong lĩnh vực Trí tuệ Nhân tạo, viết một bài báo vào tháng 7 khẳng định rằng các nhà nghiên cứu Trí tuệ Nhân tạo nên tránh việc xây dựng các chương trình có khả năng hành động tự động. “Ngay khi các hệ thống Trí tuệ Nhân tạo được đặt ra mục tiêu—để đáp ứng nhu cầu của chúng ta—chúng có thể tạo ra các mục tiêu phụ không được liên kết chặt chẽ với những gì chúng ta thực sự muốn và thậm chí có thể trở nên nguy hiểm cho con người,” viết Bengio, một giáo sư tại Đại học Montreal.
Người khác tin rằng các đại lý có thể được xây dựng một cách an toàn—và điều này có thể làm nền tảng cho sự tiến triển an toàn hơn trong Trí tuệ Nhân tạo nói chung. “Một phần quan trọng thực sự của việc xây dựng các đại lý là chúng ta cần phải tích hợp an toàn kỹ thuật vào chúng,” nói Kanjun Qiu, CEO của Imbue, một startup ở San Francisco đang làm việc về các đại lý được thiết kế để tránh sai lầm và yêu cầu sự giúp đỡ khi không chắc chắn. Công ty thông báo về 200 triệu đô la đầu tư mới trong tháng này.
Imbue đang phát triển các đại lý có khả năng duyệt web hoặc sử dụng máy tính, nhưng họ cũng đang thử nghiệm các kỹ thuật làm cho chúng an toàn hơn với các nhiệm vụ lập trình. Không chỉ tạo ra một giải pháp cho một vấn đề lập trình, các đại lý sẽ cố gắng đánh giá mức tự tin của họ trong một giải pháp và yêu cầu hướng dẫn nếu không chắc chắn. “Lý tưởng nhất, các đại lý có thể có cái nhìn tốt hơn về điều quan trọng, điều an toàn là gì và khi nào cần xác nhận từ người dùng,” nói Josh Albrecht, CTO của Imbue,
Celeste Kidd, giáo sư trợ giảng tại Đại học California, Berkeley, nghiên cứu về quá trình học của con người và cách nó có thể được mô phỏng trong máy móc, là một cố vấn cho Imbue. Cô nói rằng không rõ liệu các mô hình Trí tuệ Nhân tạo được đào tạo chỉ dựa trên văn bản hoặc hình ảnh từ web có thể tự học cách lập luận về những gì chúng đang làm, nhưng xây dựng các biện pháp an toàn trên cơ sở những khả năng đáng kinh ngạc của các hệ thống như ChatGPT là có ý nghĩa. “Sử dụng những gì Trí tuệ Nhân tạo hiện tại làm tốt—hoàn thành các nhiệm vụ lập trình và tham gia vào cuộc trò chuyện liên quan đến các hình thức logic cục bộ hơn—và xem bạn có thể đưa điều đó đến đâu, tôi nghĩ đó là rất thông minh,” cô nói.
Các đại lý mà Imbue đang xây dựng có thể tránh được các loại lỗi mà hiện nay làm hỏng những hệ thống như vậy. Nhiệm vụ của một đại lý là gửi email cho bạn bè và gia đình với chi tiết về một buổi tiệc sắp tới, nếu nó phát hiện ra rằng trường 'cc:' bao gồm hàng nghìn địa chỉ, đại lý có thể dừng lại.
Dự đoán làm thế nào một đại lý có thể bị lạc lõng không phải lúc nào cũng dễ dàng. Tháng Năm ngoái, Albrecht yêu cầu một đại lý giải một câu đố toán học khó khăn. Sau đó, anh ta đăng xuống cho đến hết ngày.
Sáng hôm sau, Albrecht kiểm tra lại, chỉ để phát hiện ra rằng đại lý đã tập trung vào một phần cụ thể của vấn đề, thử nghiệm hàng loạt các phương pháp không hoạt động—mắc kẹt trong một vòng lặp vô hạn có thể là tương đương với việc ám ảnh về một chi tiết nhỏ của Trí tuệ Nhân tạo. Trong quá trình đó, nó đã tạo ra vài nghìn đô la chi phí tính toán đám mây.
“Chúng tôi coi những sai lầm như những cơ hội học hỏi, tuy nhiên sẽ tốt nếu có thể học bài học này rẻ hơn,” Albrecht nói.
