Trí tuệ nhân tạo có thể sao chép kỹ năng học xã hội của con người trong thời gian thực, DeepMind phát hiện
Trí tuệ con người phụ thuộc nặng nề vào việc học kiến thức từ người khác — được tích lũy qua thời gian là một phần của sự tiến hóa văn hóa của chúng ta. Loại học xã hội này, được biết đến trong văn học như truyền bá văn hóa, cho phép chúng ta bắt chước hành động và hành vi trong thời gian thực. Nhưng liệu trí tuệ nhân tạo cũng có thể phát triển kỹ năng học xã hội theo cách tương tự không?
Học bắt chước đã lâu đã là một phương pháp đào tạo cho trí tuệ nhân tạo, chỉ dẫn các thuật toán quan sát con người thực hiện một nhiệm vụ và sau đó cố gắng bắt chước họ. Nhưng thường thì các công cụ trí tuệ nhân tạo cần nhiều ví dụ và tiếp xúc với lượng lớn dữ liệu để sao chép người huấn luyện mình một cách thành công.
Bây giờ, một nghiên cứu đột phá của các nhà nghiên cứu DeepMind cho rằng các tác nhân trí tuệ nhân tạo cũng có thể thể hiện kỹ năng học xã hội trong thời gian thực, bằng cách bắt chước một con người trong bối cảnh mới “mà không sử dụng bất kỳ dữ liệu con người nào đã được thu thập trước đó.”
Cụ thể, nhóm nghiên cứu tập trung vào một hình thức cụ thể của truyền bá văn hóa, được biết đến là học theo quan sát hoặc bắt chước (few-shot), nói về việc sao chép chuyển động cơ thể.
DeepMind thực hiện thí nghiệm của mình trong một môi trường mô phỏng được gọi là GoalCycle3D, một thế giới ảo với địa hình không đồng đều, đường mòn, và chướng ngại vật, mà các tác nhân trí tuệ nhân tạo phải điều hướng.
Để giúp trí tuệ nhân tạo học, các nhà nghiên cứu đã sử dụng học tăng cường. Đối với những người không quen với công việc của Pavlov trong lĩnh vực này, phương pháp này dựa trên việc đề xuất thưởng cho mọi hành vi hỗ trợ quá trình học và kết quả mong muốn — trong trường hợp này, là tìm ra đường đi đúng.
Ở giai đoạn tiếp theo, nhóm nghiên cứu thêm các tác nhân chuyên gia (được mã hóa cứng hoặc được điều khiển bởi con người) đã biết cách điều hướng trong mô phỏng. Các tác nhân trí tuệ nhân tạo nhanh chóng hiểu rằng cách tốt nhất để đến đích là học từ những người có kinh nghiệm.
Quan sát của các nhà nghiên cứu là kép. Đầu tiên, họ phát hiện rằng trí tuệ nhân tạo không chỉ học nhanh hơn khi bắt chước các chuyên gia, mà còn áp dụng kiến thức đã học được vào các đường đi ảo khác. Thứ hai, DeepMind phát hiện rằng các tác nhân trí tuệ nhân tạo vẫn có thể sử dụng kỹ năng mới của mình ngay cả khi thiếu chuyên gia, điều mà theo tác giả của nghiên cứu, là một ví dụ về học xã hội.
Mặc dù tác giả lưu ý cần thêm nghiên cứu, họ tin rằng phương pháp của họ có thể mở đường “cho tiến triển của sự tiến hóa văn hóa chơi một vai trò thuật toán trong phát triển của trí tuệ nhân tạo tổng quát.” Họ cũng mong đợi sự hợp tác chuyên ngành tiếp theo giữa lĩnh vực trí tuệ nhân tạo và tâm lý tiến hóa văn hóa.
Mặc dù nó đang ở giai đoạn đầu, bước tiến của DeepMind có thể có ảnh hưởng lớn đối với ngành công nghiệp trí tuệ nhân tạo. Sự tiến bộ này có tiềm năng giảm thiểu việc đào tạo truyền thống, tốn nhiều tài nguyên cho các thuật toán, đồng thời tăng khả năng giải quyết vấn đề của chúng. Nó cũng đặt ra câu hỏi liệu trí tuệ nhân tạo có bao giờ học được những yếu tố xã hội và văn hóa của tư duy con người.
Toàn bộ nghiên cứu được xuất bản trên tạp chí Nature Communications.
