Lo lắng về ChatGPT? Hãy Thử ChatGPT với Một Cái Búa
Tháng ba năm ngoái, chỉ hai tuần sau khi GPT-4 được phát hành, các nhà nghiên cứu tại Microsoft một cách im lặng công bố kế hoạch biên soạn hàng triệu API - các công cụ có thể thực hiện mọi thứ từ việc đặt pizza đến giải phương trình vật lý, thậm chí là điều khiển TV trong phòng khách của bạn - vào một tập hợp sẽ được truy cập bởi các mô hình ngôn ngữ lớn (LLMs). Điều này chỉ là một cột mốc trong cuộc đua trên cả ngành công nghiệp và giới học thuật để tìm ra những cách tốt nhất để dạy cho LLMs cách sử dụng các công cụ, điều này sẽ làm tăng cường khả năng của trí tuệ nhân tạo hơn bất kỳ sự tiến triển ấn tượng nào mà chúng ta đã thấy cho đến nay.
Dự án của Microsoft nhằm mục đích dạy trí tuệ nhân tạo cách sử dụng bất kỳ công cụ số nào một cách linh hoạt và hiệu quả. Hiện nay, LLMs có thể làm một công việc khá tốt trong việc đề xuất các loại nhân topping cho bạn nếu bạn mô tả sở thích dinh dưỡng của mình và có thể soạn thảo đoạn hội thoại mà bạn có thể sử dụng khi gọi điện thoại đặt món ăn. Nhưng hầu hết các công cụ trí tuệ nhân tạo không thể đặt món, ngay cả trực tuyến. Ngược lại, công cụ Assistant của Google, đã bảo trì được 7 năm, có thể tổng hợp giọng nói qua điện thoại và điền vào một biểu mẫu đặt hàng trực tuyến, nhưng nó không thể chọn nhà hàng hoặc đoán món bạn muốn. Tuy nhiên, thông qua việc kết hợp những khả năng này, một trí tuệ nhân tạo sử dụng công cụ có thể làm tất cả. Một LLM có quyền truy cập vào cuộc trò chuyện trước đó của bạn và các công cụ như máy tính calo, cơ sở dữ liệu thực đơn nhà hàng và ví thanh toán kỹ thuật số của bạn có thể khả thi đánh giá rằng bạn đang cố gắng giảm cân và muốn có một lựa chọn ít calo, tìm nhà hàng gần bạn với những loại nhân bạn thích và đặt món giao hàng. Nếu nó có quyền truy cập vào lịch sử thanh toán của bạn, nó thậm chí có thể đoán được mức tiền boa bạn thường xuyên đưa. Nếu nó có quyền truy cập vào cảm biến trên đồng hồ thông minh hoặc theo dõi thể dục của bạn, nó có thể cảm nhận khi đường huyết của bạn giảm và đặt món pizza trước khi bạn nhận ra mình đang đói.
Có lẽ ứng dụng tiềm năng thu hút nhất của việc sử dụng công cụ là khả năng cho phép trí tuệ nhân tạo tự cải thiện bản thân. Giả sử, bạn hỏi một trợ lý ảo để giúp bạn diễn giải một khía cạnh nào đó của luật La Mã cổ mà không có ví dụ trong quá trình đào tạo ban đầu của mô hình. Một mô hình ngôn ngữ mạnh mẽ được trang bị khả năng tìm kiếm cơ sở dữ liệu học thuật và kích hoạt quá trình đào tạo tự do có thể điều chỉnh hiểu biết về luật La Mã trước khi trả lời. Việc truy cập các công cụ chuyên sâu có thể giúp mô hình như vậy giải thích bản thân tốt hơn. Mặc dù các mô hình ngôn ngữ như GPT-4 đã làm một công việc khá tốt trong việc giải thích lý do khi được hỏi, những giải thích này nảy ra từ một 'hộp đen' và dễ bị lỗi và tưởng tượng. Nhưng một LLM sử dụng công cụ có thể phân tích chi tiết bên trong của nó, cung cấp đánh giá kinh Empir và giải thích xác định vì sao nó đưa ra câu trả lời mà nó đã tạo ra.
Nếu được cung cấp quyền truy cập vào các công cụ để thu thập phản hồi từ con người, một LLM sử dụng công cụ có thể thậm chí tạo ra kiến thức chuyên sâu mà chưa được ghi lại trên web. Nó có thể đặt một câu hỏi trên Reddit hoặc Quora hoặc giao một nhiệm vụ cho một con người trên Mechanical Turk của Amazon. Nó còn có thể tìm kiếm dữ liệu về sở thích của con người bằng cách thực hiện nghiên cứu khảo sát, hoặc để cung cấp một câu trả lời trực tiếp cho bạn hoặc để điều chỉnh quá trình đào tạo của nó để có thể trả lời câu hỏi tốt hơn trong tương lai. Theo thời gian, trí tuệ nhân tạo sử dụng công cụ có thể bắt đầu trông giống như con người sử dụng công cụ. Một LLM có thể tạo ra mã nguồn nhanh hơn bất kỳ lập trình viên con người nào, vì vậy nó có thể thao tác các hệ thống và dịch vụ của máy tính của bạn một cách dễ dàng. Nó cũng có thể sử dụng bàn phím và con trỏ của máy tính của bạn theo cách mà một người sẽ làm, cho phép nó sử dụng bất kỳ chương trình nào bạn sử dụng. Và nó có thể cải thiện khả năng của mình, sử dụng công cụ để đặt câu hỏi, thực hiện nghiên cứu và viết mã để tích hợp vào bản thân nó.
Dễ nhìn thấy là cách sử dụng công cụ như thế mang lại những rủi ro khổng lồ. Hãy tưởng tượng một LLM có khả năng tìm kiếm số điện thoại của ai đó, gọi điện và lén ghi âm giọng của họ, đoán ngân hàng họ sử dụng dựa trên các nhà cung cấp lớn nhất trong khu vực của họ, mạo danh họ trong một cuộc gọi điện thoại với dịch vụ khách hàng để đặt lại mật khẩu, và chuyển toàn bộ tài khoản của họ để tạo quyên góp cho một đảng chính trị. Mỗi nhiệm vụ này đều gọi một công cụ đơn giản—một tìm kiếm internet, một tổng hợp giọng, một ứng dụng ngân hàng—và LLM tạo kịch bản chuỗi hành động bằng cách sử dụng các công cụ.
Người quản lý nên xem xét những gì trí tuệ nhân tạo được phép tự động thực hiện, như việc họ có thể được chỉ định sở hữu tài sản hoặc đăng ký kinh doanh. Có lẽ các giao dịch nhạy cảm hơn nên yêu cầu một con người đã được xác minh tham gia, ngay cả với một số sự ma sát thêm vào. Hệ thống pháp lý của chúng ta có thể không hoàn hảo, nhưng chúng ta chủ yếu biết cách đặt trách nhiệm cho con người khi họ vi phạm; điều khó khăn là không để họ chuyển trách nhiệm của mình sang bên thứ ba nhân tạo. Chúng ta nên tiếp tục tìm kiếm những giải pháp quy định cụ thể cho trí tuệ nhân tạo trong khi cũng nhận ra rằng chúng không đủ một mình.
Chúng ta cũng phải chuẩn bị cho những cách tích cực mà trí tuệ nhân tạo sử dụng công cụ có thể ảnh hưởng đến xã hội. Trong kịch bản tốt nhất, một hệ thống LLM như vậy có thể nhanh chóng thúc đẩy một lĩnh vực như phát hiện thuốc, và cơ quan sở hữu bản quyền và FDA nên chuẩn bị cho một sự tăng đột ngột trong số ứng viên thuốc hợp lệ. Chúng ta nên định hình cách chúng ta tương tác với chính phủ để tận dụng các công cụ trí tuệ nhân tạo mang lại khả năng lớn hơn để lời nói của chúng ta được nghe. Và chúng ta nên đảm bảo rằng những lợi ích kinh tế từ trí tuệ nhân tạo siêu thông minh, tiết kiệm lao động được phân phối công bằng.
Chúng ta có thể tranh cãi liệu LLM có thực sự thông minh hoặc có ý thức, hoặc có cơ quan không, nhưng trí tuệ nhân tạo sẽ trở nên ngày càng có khả năng sử dụng công cụ một cách hiệu quả. Một số điều lớn hơn là tổng số của chúng. Một trí tuệ nhân tạo có khả năng thao tác và tương tác với ngay cả các công cụ đơn giản sẽ trở nên mạnh mẽ hơn rất nhiều so với chính những công cụ đó. Hãy chắc chắn rằng chúng ta đã sẵn sàng cho chúng.
Quan điểm MYTOUR đăng bài viết của các đồng sáng tác bên ngoài đại diện cho một loạt các quan điểm. Đọc thêm ý kiến tại đây. Gửi một bài viết tại [email protected].
