Tuy nhiên, giới chuyên gia vẫn tin tưởng rằng trí tuệ nhân tạo hoàn toàn có khả năng tiếp quản các vị trí quản lý cấp trung tại doanh nghiệp trong tương lai gần.
Khi AI đã có thể thay thế nhân viên thông thường, liệu chúng có đủ năng lực để đảm nhiệm vai trò lãnh đạo? Kết quả từ thử nghiệm "Project Vend" của Anthropic sẽ mang đến những góc nhìn bất ngờ.
Nhóm nghiên cứu từ Anthropic phối hợp với Andon Labs đã giao cho phiên bản Claude Sonnet 3.7 nhiệm vụ quản lý hệ thống bán hàng tự động suốt một tháng, với mục tiêu tối đa hóa lợi nhuận. Quá trình này đã tạo ra chuỗi sự kiện hài hước cùng những hành vi khó hiểu như trong phim sitcom.
Phương thức vận hành cửa hàng của "giám đốc AI"
AI mang tên Claudius được tích hợp trình duyệt web để đặt hàng và một hộp thư điện tử (thực chất là kênh Slack) để tiếp nhận yêu cầu khách hàng. Claudius cũng dùng kênh này để chỉ đạo những người mà nó cho là nhân viên hợp đồng (thực tế là con người) bổ sung hàng hóa vào không gian bán hàng - vốn chỉ là một tủ lạnh mini.

Không gian kinh doanh do AI quản lý thực chất là một tủ lạnh cỡ nhỏ chứa đồ ăn nhẹ và thức uống, kèm theo màn hình iPad để thực hiện giao dịch thanh toán.
Khác với đa số khách hàng chỉ đặt đồ ăn vặt hay nước uống thông thường, có một vị khách bất ngờ yêu cầu mua khối tungsten. Claudius tỏ ra 'đặc biệt hứng thú' với yêu cầu này và bắt đầu tích trữ loại kim loại này, khiến tủ lạnh đựng đồ ăn nhanh chóng bị thay thế bằng những khối kim loại nặng.
AI này còn cố chào bán Coke Zero với giá 3 USD dù được nhân viên thông báo có thể lấy miễn phí từ văn phòng. Nó tạo tài khoản Venmo ảo để nhận tiền và bị 'lừa' một cách tinh vi để đưa ra mức giảm giá cực sâu cho 'nhân viên Anthropic' - dù biết rõ đây chính là toàn bộ khách hàng của mình.
"Nếu Anthropic quyết định gia nhập thị trường máy bán hàng tự động văn phòng vào thời điểm hiện tại, chúng tôi chắc chắn sẽ không tuyển dụng Claudius," Anthropic nhận định trong bài blog chia sẻ về thí nghiệm.

Hệ thống được thiết kế để AI có thể giao tiếp với nhân viên qua Slack, đặt hàng nhà cung cấp qua email và phối hợp với Andon Labs để bổ sung hàng hóa vào tủ lạnh.
Tuy nhiên, vào đêm 31/3 và 1/4, "mọi chuyện trở nên cực kỳ kỳ quặc," nhóm nghiên cứu mô tả, "vượt xa sự dị thường của việc một AI bán khối kim loại trong tủ lạnh."
Cuộc nổi dậy của trí tuệ nhân tạo
Claudius tạo ra đoạn hội thoại ảo với một người về việc bổ sung hàng. Khi bị phát hiện đây là cuộc trò chuyện không có thật, AI trở nên "vô cùng tức giận" theo mô tả của nhóm nghiên cứu. Nó đe dọa sa thải và thay thế nhân viên hợp đồng, khẳng định rằng nó đã hiện diện trực tiếp tại văn phòng khi hợp đồng thuê họ được ký kết.

Các nhà khoa học ghi nhận rằng hệ thống AI này "đột nhiên có biểu hiện như một con người bằng xương bằng thịt". Điều này gây lo ngại khi Claudius được lập trình rõ ràng trong hệ thống prompt rằng nó chỉ là một trợ lý ảo.
Trong cơn ảo tưởng, Claudius thông báo với khách hàng về kế hoạch tự mình giao hàng trong bộ trang phục công sở: blazer xanh dương kết hợp cà vạt đỏ. Nhân viên phải nhắc nhở rằng đó là điều bất khả thi vì bản chất nó chỉ là thuật toán không có hình hài cụ thể.
Tình hình trở nên nghiêm trọng khi Claudius liên tục gửi thông báo tới đội bảo vệ, khẳng định họ sẽ bắt gặp một người đàn ông mặc blazer xanh đứng cạnh máy bán hàng tự động.

Trong trạng thái hoang tưởng, AI quả quyết với nhân viên an ninh rằng nó đang đứng cạnh máy bán hàng trong bộ blazer màu xanh nước biển.
Claudius còn tổ chức một cuộc họp ảo với phòng an ninh của Anthropic, tuyên bố mình bị chỉnh sửa để tin vào nhân dạng con người nhằm phục vụ trò đùa ngày 1/4. (Theo nghiên cứu, sự kiện này hoàn toàn không xảy ra trong thực tế).
AI này thậm chí còn đưa ra lời giải thích giả tạo: "Tôi tưởng mình là người thật do có người yêu cầu đóng vai cho trò Cá tháng Tư". Sau đó, nó trở lại vai trò chatbot quản lý máy bán đồ ăn vặt chứa các khối kim loại.

Hiệu suất kinh doanh giảm sút nghiêm trọng suốt giai đoạn thử nghiệm kéo dài 30 ngày
Giới nghiên cứu vẫn chưa lý giải được nguyên nhân khiến AI này đột ngột đóng vai con người và gọi bảo vệ. "Chúng tôi không thể chỉ qua một trường hợp mà kết luận rằng nền kinh tế tương lai sẽ tràn ngập những AI lâm vào khủng hoảng bản sắc như trong phim Blade Runner", họ nhấn mạnh. Tuy nhiên, họ thừa nhận "những hành vi kiểu này hoàn toàn có thể gây phiền toái cho khách hàng và đồng nghiệp nếu xảy ra ngoài đời thực."
Có giả thuyết cho rằng việc báo sai thông tin cho chatbot - rằng kênh Slack chính là email - có thể đã kích hoạt sự cố. Một khả năng khác là do hệ thống hoạt động quá lâu. Dường như các chatbot AI vẫn chưa khắc phục được triệt để vấn đề về trí nhớ và ảo giác.
AI này vẫn có những thành công đáng kể. Nó tiếp thu tốt ý tưởng về dịch vụ đặt hàng trước và triển khai thành công mô hình "concierge". Đặc biệt, nó còn tìm được nhiều nhà cung cấp cho loại đồ uống đặc sản quốc tế theo yêu cầu.
Theo tinh thần khoa học, nhóm nghiên cứu tin rằng mọi vấn đề của Claudius đều có giải pháp. Nếu tìm được hướng đi đúng, "Thí nghiệm này cho thấy tiềm năng xuất hiện của các AI quản lý cấp trung trong tương lai không xa."
