Google DeepMind đang tập hợp một nhóm nghiên cứu AI mới để phát triển 'mô hình thế giới' có khả năng mô phỏng các môi trường vật lý. Đây là một sáng kiến quan trọng trong nỗ lực của Google nhằm đạt được trí tuệ nhân tạo tổng quát (AGI) trước các đối thủ cạnh tranh.
Google DeepMind đang xây dựng một đội ngũ chuyên gia AI mới để phát triển 'mô hình thế giới', với khả năng tái tạo các môi trường vật lý. Sáng kiến này được dẫn dắt bởi Tim Brooks, cựu đồng lãnh đạo dự án Sora tại OpenAI, người đã gia nhập DeepMind vào tháng 10 để tập trung vào phát triển các trình tạo video và các hệ thống mô phỏng của Google.
Mô hình thế giới là một lĩnh vực mới trong AI, hứa hẹn mang lại nhiều ứng dụng khác nhau, từ tạo môi trường tương tác thời gian thực cho game và phim, đến các kịch bản huấn luyện thực tế cho robot và hệ thống AI. Dự án này đánh dấu một bước tiến quan trọng trong tham vọng của Google để đạt được trí tuệ nhân tạo tổng quát (AGI), vượt qua các đối thủ cạnh tranh.

Trong một bài đăng trên nền tảng X vào thứ Hai, Tim Brooks đã chia sẻ về 'kế hoạch đầy tham vọng' của DeepMind trong việc phát triển các mô hình sinh sản quy mô lớn để mô phỏng thế giới thực. Ông cũng đăng tải thông tin tuyển dụng cho các kỹ sư và nhà nghiên cứu, những người sẽ tham gia vào việc giải quyết các thách thức liên quan đến đào tạo quy mô lớn, quản lý dữ liệu, và tích hợp các mô hình ngôn ngữ đa phương thức vào mô hình thế giới.
Theo mô tả công việc, DeepMind cho biết: 'Chúng tôi tin rằng việc mở rộng quy mô đào tạo trên video và dữ liệu đa phương thức là con đường quan trọng dẫn đến trí tuệ nhân tạo tổng quát. Mô hình thế giới sẽ hỗ trợ nhiều lĩnh vực, từ lập luận và mô phỏng trực quan, đến lập kế hoạch cho các tác nhân cụ thể và giải trí thời gian thực.'
Cuộc cạnh tranh trong việc đạt được AGI ngày càng trở nên khốc liệt. OpenAI, dưới sự lãnh đạo của CEO Sam Altman, gần đây đã tuyên bố rằng họ đã tìm ra cách đạt được tiêu chuẩn AGI, và các tác nhân AI tự động có thể bắt đầu đóng vai trò quan trọng trong lực lượng lao động ngay trong năm nay.
Tuy vậy, DeepMind không phải là công ty duy nhất chú trọng vào mô hình thế giới. Nvidia đã ra mắt nền tảng Cosmos dành cho AI vật lý, xe tự lái và robot; trong khi startup World Labs, do 'mẹ đỡ đầu của AI' Fei-Fei Li sáng lập, cũng đang gia nhập lĩnh vực này.
Đội ngũ mới của DeepMind sẽ hợp tác chặt chẽ với các dự án AI hiện tại của Google, bao gồm mô hình AI Gemini, trình tạo video Veo, và dự án mô phỏng Genie – một mô hình thế giới của Google trước đây, được phát triển để tạo ra các môi trường 3D tương tác thời gian thực. Với sự kết hợp giữa chuyên môn sâu và tham vọng lớn, DeepMind đang chuẩn bị xây dựng nền tảng cho bước tiến tiếp theo trong công nghệ trí tuệ nhân tạo.
Ánh Viên
