Quên cờ vua, DeepMind đào tạo trí tuệ nhân tạo mới của mình để chơi bóng đá
Các nhà nghiên cứu từ DeepMind, phòng thí nghiệm trí tuệ nhân tạo hàng đầu của Anh, đã từ bỏ những trò chơi quý tộc như cờ vua và Go để chuyển đến một niềm vui dành cho đại chúng hơn: bóng đá.
Công ty con của Google đã công bố một bài báo nghiên cứu và bài đăng blog đi kèm mô tả về những nguyên tắc điều khiển đa dạng mới (NPMP) của nó - một phương pháp mà các đặc vụ trí tuệ nhân tạo có thể học cách vận động cơ thể vật lý.
Theo bài đăng blog:
Một NPMP là một mô-đun điều khiển đa dụng chuyển đổi ý định vận động ngắn hạn thành tín hiệu kiểm soát cấp thấp, và nó được đào tạo ngoại tuyến hoặc thông qua học máy tăng cường bằng cách bắt chước dữ liệu thu được từ theo dõi trên con người hoặc động vật thực hiện các chuyển động quan trọng.
Trước mặt: Đơn giản, đội ngũ DeepMind đã tạo ra một hệ thống trí tuệ nhân tạo có thể học cách thực hiện các nhiệm vụ bên trong một trình mô phỏng vật lý bằng cách xem video của các đặc vụ khác thực hiện những nhiệm vụ đó.
Và, tất nhiên, nếu bạn có một trình mô phỏng vật lý khổng lồ và một nguồn cung cấp không ngừng các robot tò mò, thì điều duy nhất hợp lý là dạy nó cách đi bóng và sút bóng:
Hội nghị TNW 2024 - Mời tất cả các Startup tham gia vào ngày 20-21 tháng 6
Trình diễn startup của bạn trước các nhà đầu tư, những người thay đổi và khách hàng tiềm năng với các gói Startup được tạo ra theo sự chọn lọc của chúng tôi.
Theo bài báo nghiên cứu của đội ngũ:
Chúng tôi đã tối ưu hóa các đội ngũ đặc vụ để chơi bóng đá ảo thông qua việc học máy tăng cường, hạn chế không gian giải pháp chỉ trong phạm vi của các chuyển động có thể học được sử dụng dữ liệu theo dõi chuyển động của con người.
Nền tảng: Để đào tạo trí tuệ nhân tạo để vận hành và kiểm soát robot trong thế giới thực, các nhà nghiên cứu phải chuẩn bị các máy móc cho hiện thực. Và, ngoài các mô phỏng, bất cứ điều gì cũng có thể xảy ra. Các đặc vụ phải đối mặt với trọng lực, bề mặt trơn trượt đột ngột và sự can thiệp không kế hoạch từ các đặc vụ khác.
Mục tiêu của bài tập không phải là xây dựng một cầu thủ bóng đá giỏi hơn - Cristiano Ronaldo hiện vẫn chưa có gì phải lo lắng với những robot, ít nhất là trong lúc này - mà thay vào đó là giúp trí tuệ nhân tạo và các nhà phát triển của nó tìm ra cách tối ưu hóa khả năng dự đoán kết quả của các đặc vụ.
Trong quá trình huấn luyện, trí tuệ nhân tạo chỉ mới có khả năng di chuyển con avatar nhân vật hình người dựa trên vật lý trên sân. Nhưng, thông qua việc thưởng cho một đại lý mỗi khi đội của nó ghi bàn, mô hình có thể đưa ra các con số trong khoảng 50 giờ. Sau vài ngày huấn luyện, trí tuệ nhân tạo bắt đầu dự đoán vị trí của quả bóng sẽ đi và cách các đại lý khác sẽ phản ứng với sự di chuyển của nó.
Theo bài báo:
Kết quả là một đội bóng đá nhân vật hình người được phối hợp có hành vi phức tạp ở các quy mô khác nhau, được đo lường bằng nhiều phân tích và thống kê, bao gồm cả những thống kê được sử dụng trong phân tích thể thao thực tế. Công việc của chúng tôi là một minh chứng hoàn chỉnh về quyết định tích hợp học được ở nhiều quy mô trong một môi trường nhiều đại lý.
Quan điểm nhanh: Công việc này thực sự ấn tượng. Nhưng chúng tôi không chắc liệu nó có đại diện cho một “minh chứng hoàn chỉnh” của bất cứ điều gì không. Mô hình rõ ràng có khả năng vận hành một đại lý thể hiện. Nhưng, dựa trên có vẻ như được chọn lọc các hình ảnh GIF trên bài đăng blog, công việc này vẫn đang ở giai đoạn mô phỏng sâu.
Điểm quan trọng ở đây là, trí tuệ nhân tạo không “học” cách chơi bóng đá. Nó đang vận hành chuyển động mạnh mẽ trong ranh giới của mô phỏng của nó. Điều đó có thể dường như là một ý kiến chủ quan nhỏ, nhưng kết quả là rất rõ ràng:
Đại lý trí tuệ nhân tạo ở trên trông hoàn toàn sợ hãi. Tôi không biết nó đang chạy trốn khỏi cái gì, nhưng tôi chắc chắn rằng đó là điều đáng sợ nhất từng có.
Nó di chuyển như một sinh vật ngoài hành tinh đang mặc lớp áo người lần đầu tiên vì, khác với con người, trí tuệ nhân tạo không thể học bằng cách quan sát. Các hệ thống như những hệ thống mà DeepMind đã đào tạo phân tích hàng nghìn giờ video và, về cơ bản, trích xuất dữ liệu về chuyển động của chủ đề mà họ đang cố “học” từ.
Tuy nhiên, có khả năng cao rằng những mô hình này sẽ trở nên mạnh mẽ hơn khi thời gian trôi qua. Chúng ta đã thấy những gì Boston Dynamics có thể làm với các thuật toán học máy và kịch bản được lập trình trước.
Thú vị để xem những mô hình linh hoạt hơn, như những mô hình đang được phát triển bởi DeepMind, sẽ thể hiện như thế nào khi chúng vượt ra khỏi môi trường phòng thí nghiệm và đi vào ứng dụng thực tế của robot.
