Nghiên cứu này là sản phẩm của một startup AI, với mục tiêu tạo ra nhiều 'con người số' để hợp tác giải quyết các vấn đề thực tiễn.

Trong một thí nghiệm được thực hiện trong thế giới Minecraft, các nhà nghiên cứu đã bất ngờ trước khả năng tự lập của nhóm nhân vật AI. Chúng không chỉ sinh tồn mà còn phát triển vượt ngoài kỳ vọng. Các nhân vật này tự tìm ra những công việc cần thiết trong thế giới, chia sẻ meme, yêu cầu cải cách thuế và thậm chí là truyền đạo.
Cụ thể, nghiên cứu đã đưa vào thế giới Minecraft khoảng 1.000 nhân vật được điều khiển bởi mô hình ngôn ngữ lớn (LLM, công nghệ đằng sau hay Gemini). Trong thế giới ảo này, chúng có thể tương tác với nhau.
Sau khi nhận được một số hướng dẫn từ các nhà khoa học về cách hành xử, các nhân vật này đã tự phát triển những tính cách riêng biệt, sở thích và thậm chí là phân công vai trò cho nhau trong thế giới ảo. Chúng làm được điều này mà không cần sự can thiệp thêm từ các nhà nghiên cứu.

Các AI tự tương tác và đưa ra quyết định của riêng chúng - Ảnh: Altera.
Nghiên cứu này do startup AI Altera thực hiện và thuộc về một lĩnh vực nghiên cứu rộng lớn hơn. Các chuyên gia sử dụng mô phỏng để dự đoán cách con người sẽ phản ứng với các chính sách kinh tế mới hoặc những thay đổi có tác động lớn đến xã hội.
Robert Yang, người sáng lập Altera, trước đây là trợ lý giáo sư về khoa học điện toán thần kinh tại MIT, đã từ bỏ công việc để theo đuổi dự án này. Ông khẳng định rằng phiên bản demo hiện tại chỉ là bước khởi đầu và mục tiêu lớn hơn là xây dựng các "nền văn minh AI" quy mô lớn, nơi các tác nhân AI có thể chung sống và hợp tác với con người trong thế giới số.
Ông chia sẻ: “Sức mạnh thực sự của AI sẽ được khai thác khi chúng ta có các hệ thống hoàn toàn tự động, có khả năng hợp tác quy mô lớn”.
Niềm đam mê của Yang được truyền cảm hứng từ nghiên cứu của Joon Sung Park tại Đại học Stanford. Vào năm 2023, Park đã phát hiện những hành vi gần như con người của 25 tác nhân AI, tự vận hành và tương tác trong một môi trường ảo.

Các AI trong Minecraft đang tự tạo ra nền văn minh riêng của mình - Ảnh: Internet.
“Ngay khi nghiên cứu của anh ấy được công bố, chúng tôi đã bắt đầu công việc ngay tuần sau đó,” Yang chia sẻ. Sau sáu tháng, ông quyết định rời MIT để tập trung hoàn toàn vào dự án này. “Chúng tôi muốn đẩy giới hạn của các tác nhân khi hoạt động độc lập trong nhóm.”
Altera nhanh chóng huy động được hơn 11 triệu USD từ các nhà đầu tư, bao gồm A16Z và quỹ đầu tư mạo hiểm công nghệ mới nổi của cựu CEO Google, Eric Schmidt. Đầu năm nay, Altera ra mắt bản demo đầu tiên, một nhân vật AI điều khiển trong trò chơi Minecraft có thể chơi cùng game thủ.
Dự án mới của Altera, có tên Project Sid, sử dụng các tác nhân AI với “bộ não” gồm nhiều mô-đun khác nhau, đảm nhiệm các nhiệm vụ riêng biệt. Một số mô-đun được điều khiển bởi mô hình ngôn ngữ lớn (LLMs) và được thiết kế để thực hiện các nhiệm vụ cụ thể, như phản ứng với các tác nhân khác, giao tiếp hoặc lên kế hoạch cho hành động tiếp theo.
Chi tiết nghiên cứu
Nhóm nghiên cứu bắt đầu với quy mô nhỏ, thử nghiệm 50 tác nhân AI trong Minecraft và theo dõi sự tương tác của chúng. Sau 12 ngày trong trò chơi (tương đương 4 giờ trong thế giới thực), các tác nhân này đã thể hiện nhiều hành vi tự phát đầy thú vị.
Ví dụ, một số tác nhân trở nên hòa đồng và tạo dựng mối quan hệ với các nhân vật khác, trong khi những tác nhân khác lại có xu hướng sống nội tâm. Chỉ số "được yêu thích" của mỗi tác nhân (do chính các tác nhân tự đánh giá) thay đổi sau mỗi lần tương tác. Các tác nhân cũng có khả năng nhận diện tín hiệu xã hội và tự đưa ra phản ứng thích hợp.
Một ví dụ điển hình là khi một đầu bếp AI được giao nhiệm vụ phát thực phẩm, nó đã ưu tiên phân phát cho những nhân vật mà nó cho là đã đánh giá cao mình.

Các nhân vật AI tự tương tác trong game - Ảnh: Altera.
Những hành vi giống con người tiếp tục xuất hiện trong một thử nghiệm khác với 30 tác nhân AI. Mặc dù tất cả đều bắt đầu với tính cách và mục tiêu chung là xây dựng một ngôi làng hiệu quả và bảo vệ cộng đồng khỏi các mối đe dọa từ sinh vật khác, chúng đã tự phát triển các vai trò chuyên biệt trong cộng đồng mà không cần thêm bất kỳ hướng dẫn nào.
Các tác nhân tự phân công vai trò như thợ xây, người bảo vệ, thương nhân và nhà thám hiểm. Khi một tác nhân bắt đầu chuyên môn hóa, các hành động trong trò chơi của nó phản ánh vai trò mới. Ví dụ, một nghệ sĩ sẽ dành nhiều thời gian hái hoa, nông dân tập trung thu thập hạt giống, trong khi lính gác xây dựng thêm hàng rào để bảo vệ làng.
“Chúng tôi rất bất ngờ khi nhận ra rằng, chỉ cần trang bị một bộ não phù hợp, các tác nhân này có thể thể hiện những hành vi tự phát rất ấn tượng,” Yang chia sẻ. “Chúng tôi nghĩ rằng điều này chỉ có thể xảy ra ở con người, nhưng không ngờ máy móc cũng có thể làm được điều này.”
Trong những thử nghiệm tiếp theo, ông Yang và nhóm nghiên cứu kiểm tra xem liệu các tác nhân có thể tuân theo các quy tắc cộng đồng hay không. Họ tạo ra một thế giới với một hệ thống thuế cơ bản và cho phép các tác nhân bỏ phiếu thay đổi chính sách thuế trong trò chơi.
Trong cộng đồng, một số tác nhân ủng hộ và một số phản đối hệ thống thuế. Những tác nhân này có thể ảnh hưởng đến những tác nhân khác mà chúng tương tác, khuyến khích họ thay đổi quan điểm và bỏ phiếu điều chỉnh thuế.

Nhóm nghiên cứu đã mở rộng quy mô thử nghiệm, tăng số lượng tác nhân lên mức tối đa mà máy chủ Minecraft có thể xử lý mà không gặp sự cố, đạt đến 1.000 tác nhân trong một số thử nghiệm.
Trong một thử nghiệm với 500 tác nhân, nhóm nghiên cứu quan sát thấy các tác nhân tự phát tạo ra và lan truyền các meme phản ánh các xu hướng văn hóa đương đại, như sở thích đùa giỡn hay mối quan tâm về các vấn đề môi trường.
Nhóm cũng thử nghiệm với một nhóm nhỏ các tác nhân để lan truyền tôn giáo Pastafarianism, một tín ngưỡng cho rằng trên trời có một con quái vật bay được làm từ mỳ Spaghetti. Họ theo dõi cách các “linh mục Pastafarian” truyền bá niềm tin này, chuyển đổi niềm tin của các tác nhân mà họ tương tác, và sau khi được cảm hóa, các tác nhân này lại tiếp tục truyền bá giáo lý của Giáo hội Quái vật Spaghetti Bay.
Kết luận của nhóm nghiên cứu
Hành động của AI có thể trông như thật, nhưng thực tế chỉ là sự kết hợp các mẫu hành vi mà các mô hình ngôn ngữ lớn học từ dữ liệu do con người cung cấp. Khi kết hợp với hệ thống của Altera, chúng có thể chuyển những mẫu hành vi này thành các hành động có ngữ cảnh, như nhặt dụng cụ hay tương tác với các tác nhân khác.
“Điều quan trọng là, các LLM có mô hình xã hội rất phức tạp, giúp hành động của chúng phản ánh hành vi con người một cách chính xác,” Andrew Ahn, đồng sáng lập Altera, chia sẻ.
Nói cách khác, dữ liệu cho phép AI mô phỏng hành vi của con người một cách rất tinh tế, nhưng chúng không phải là “sinh vật sống” thực sự.
Hiện tại, Yang đang lên kế hoạch mở rộng dự án. Altera dự định sẽ áp dụng công nghệ của mình trên nền tảng Roblox, với hy vọng kết hợp những AI giống con người này vào các hoạt động hàng ngày.
Mục tiêu lớn nhất của ông là tạo ra một số lượng lớn những “con người số” thực sự quan tâm và sẵn sàng hợp tác với chúng ta để giải trí cũng như giải quyết các vấn đề thực tiễn.
“Chúng tôi muốn tạo ra những tác nhân thực sự yêu quý con người (giống như cách chó yêu con người),” ông chia sẻ.

Nhóm sáng lập Altera - Ảnh: Altera.
Quan điểm cho rằng AI có thể yêu thương chúng ta đang gây tranh cãi trong cộng đồng nghiên cứu trí tuệ nhân tạo. Các chuyên gia cho rằng công nghệ không thể tái tạo cảm xúc. Julian Togelius, một chuyên gia AI lâu năm và là người sáng lập công ty Modl.ai chuyên thử nghiệm game, thừa nhận ông đánh giá cao công việc của Altera, vì nó giúp chúng ta nghiên cứu hành vi con người trong môi trường mô phỏng.
Nhưng liệu các tác nhân mô phỏng này có thể học cách yêu thương, quan tâm chúng ta hay trở nên tự nhận thức được không? Togelius không nghĩ như vậy. “Không có lý do gì để tin rằng một mạng neuron trên GPU có thể có cảm giác,” ông nói.
Tuy nhiên, có thể AI không cần phải yêu thương chúng ta để trở nên hữu ích.
“Nếu câu hỏi là liệu một trong những tác nhân mô phỏng này có thể thể hiện sự quan tâm, tinh tế đến mức giống tình yêu giữa con người, thì có lẽ không phải là không thể,” Togelius bổ sung.
“Bạn có thể tạo ra một mô phỏng sự quan tâm đủ thuyết phục để thực sự hữu ích. Câu hỏi là, liệu người được chăm sóc có quan tâm đến việc người chăm sóc mình không có trải nghiệm thực tế hay không.”
Nói cách khác, miễn là các nhân vật AI có thể thể hiện sự quan tâm một cách thuyết phục, đó có thể là đủ để chúng ta cảm thấy thỏa mãn.
Theo MIT Technology
