Đây là bước tiến quan trọng giúp robot thoát khỏi giới hạn của phòng thí nghiệm và bước vào thế giới thực.
Gần đây, Google đã đạt được nhiều thành tựu đáng kể trong việc phát triển mô hình AI Gemini, với khả năng phân tích đa phương thức bao gồm văn bản, hình ảnh, âm thanh, video và giải quyết các vấn đề phức tạp thông qua lập luận. Tuy nhiên, những ứng dụng của Gemini hiện vẫn chỉ giới hạn trong môi trường ảo.
Chính vì thế, Google DeepMind đã công bố hai mô hình AI mới dựa trên nền tảng Gemini 2.0, nhằm xây dựng một hệ thống hỗ trợ cho lực lượng robot trong tương lai. Về bản chất, Google đang hướng tới việc tạo ra một “hệ điều hành” dành cho nguồn nhân lực robot giá rẻ.

Gemini Robotics hướng dẫn cánh tay robot gấp origami - Ảnh: Google.
Mô hình đầu tiên có tên Gemini Robotics, một hệ thống tích hợp thị giác - ngôn ngữ - hành động (VLA), giúp robot hiểu và thực hiện các tác vụ trong môi trường thực. Mô hình thứ hai là Gemini Robotics-ER, tập trung vào khả năng lập luận không gian, hỗ trợ robot định vị, nhận diện vật thể 3D và tự lập kế hoạch thực hiện chức năng.
Hai mô hình mới này sẽ giúp robot thực hiện nhiều nhiệm vụ thực tế đa dạng, từ đó thúc đẩy việc đưa robot vào lực lượng lao động một cách nhanh chóng.
Google phát triển các mô hình AI dựa trên ba nguyên tắc chính:
Tính linh hoạt (generality): giúp robot có khả năng thích ứng với nhiều tình huống đa dạng.
Tính phản hồi (interactivity): giúp robot hiểu và phản ứng nhanh chóng với các hướng dẫn hoặc thay đổi trong môi trường xung quanh.
Khả năng thao tác tinh vi (dexterity): giúp robot thực hiện các động tác phức tạp như cầm nắm và điều khiển vật thể một cách chính xác, tương tự như con người.
Ngoài ra, Gemini Robotics còn được thiết kế để tương thích với nhiều loại robot khác nhau, vì mỗi doanh nghiệp hay tập đoàn đều có thiết kế robot riêng biệt. Google hy vọng rằng dù robot có một hay nhiều cánh tay, với số lượng ngón tay khác nhau, phần mềm Gemini Robotics vẫn đảm bảo phần cứng hoạt động hiệu quả.

Liệu công việc "dọn dẹp" sẽ bị robot thay thế? - Ảnh: Google.
Google khẳng định rằng trong các thử nghiệm, Gemini Robotics đã giúp robot hoàn thành tốt các nhiệm vụ mà chúng chưa từng được huấn luyện trước đó. Điều này chứng minh tính linh hoạt, phản hồi và khả năng thao tác tinh vi của hệ thống đã được phát huy tối đa.
Ngoài ra, Google cũng cam kết phát triển một mô hình AI đảm bảo an toàn cho robot trong quá trình hoạt động, không chỉ cho bản thân chúng mà còn cho những người xung quanh và hướng tới những mục đích tích cực.
Từ những yêu cầu cơ bản như tránh va chạm, kiểm soát lực tác động cho đến việc tuân thủ các quy tắc an toàn được xây dựng và đánh giá bởi chuyên gia, Google luôn đề cao trách nhiệm trong việc phát triển ứng dụng AI. Mục tiêu của họ là tạo ra một đội ngũ robot an toàn, hiệu quả và phù hợp với lợi ích của con người.
