Gã khổng lồ công nghệ kỳ vọng thế hệ robot tương lai sẽ sở hữu khả năng tư duy phức tạp như con người
Phòng nghiên cứu AI hàng đầu của Google vừa công bố bước đột phá trong nỗ lực phát triển robot có nhận thức sâu sắc. Họ đang xây dựng hệ thống mô phỏng quá trình 'tự độc thoại' trong tư duy máy móc.
Bằng sáng chế đang được phát triển mô tả công nghệ cho phép AI phân tích hình ảnh/video về hành vi con người, sau đó dùng mô hình ngôn ngữ để diễn giải thành lời. Ví dụ, khi thấy ai đó cầm ly nước, robot không chỉ ghi nhận hình ảnh mà còn tự hình thành suy nghĩ: 'Người này đang nhặt cốc'. Cách tiếp cận này giúp máy móc không chỉ quan sát mà còn biết phân tích, tiến gần hơn đến khả năng nhận thức nhiệm vụ.

Công nghệ này mở đường cho khả năng học 'zero-shot', cho phép robot tương tác với vật thể mới mà không cần đào tạo trước. DeepMind nhấn mạnh hệ thống còn tối ưu hóa bộ nhớ và năng lực xử lý - hai thách thức lớn trong đào tạo AI vận hành robot.
Mới đây, DeepMind đã giới thiệu mô hình robot đa phương thức (thị giác-ngôn ngữ) có thể chạy offline, không cần kết nối mạng, đánh dấu bước tiến trong phát triển AI nhẹ nhưng mạnh mẽ.
Bối cảnh càng rõ ràng, hiệu suất robot càng cao. Quá trình 'tự độc thoại' thực chất là lớp dữ liệu ngữ nghĩa giá trị, giúp robot xử lý linh hoạt các tình huống mới phát sinh.
Dù vậy, tính khó lường trong hành vi của robot AI vẫn là rào cản khiến nhiều công ty e ngại. Các tập đoàn công nghệ hàng đầu như Google, NVIDIA và Intel đều đang phát triển các giải pháp sáng tạo để xử lý thách thức này.
Cuộc cạnh tranh AI giờ đây không chỉ xoay quanh hiệu suất thuần túy, mà còn là khả năng thích nghi với môi trường thực tế. Trong tương lai, robot có thể đạt được năng lực 'tư duy bằng ngôn ngữ' như con người, và khởi nguồn sẽ đến từ khái niệm mang tên 'đối thoại nội tâm'.

