Có Thể Bots Lừa Đảo Con Người Trong Một Trong Những Trò Chơi Esports Lớn Nhất?
Tháng Tám này, một số trong những game thủ chuyên nghiệp xuất sắc nhất thế giới sẽ đến Vancouver để chiến đấu vì hàng triệu đô la trong cuộc thi thể thao điện tử quý giá nhất thế giới. Họ sẽ được tham gia cùng một đội năm bot trí tuệ nhân tạo do Elon Musk tài trợ, cố gắng đặt ra một dấu mốc mới cho sức mạnh của học máy.
Những bot được phát triển bởi OpenAI, một viện nghiên cứu độc lập mà CEO Tesla đồng sáng lập vào năm 2015 để thúc đẩy trí tuệ nhân tạo và ngăn chặn công nghệ trở nên nguy hiểm.
Vancouver đang tổ chức giải đấu thế giới hàng năm của Dota 2, một trong những trò chơi video được xem nhiều nhất trên internet. Tổng giải thưởng là hơn 15 triệu đô la và không ngừng tăng, vượt qua 11 triệu đô la ở giải golf Masters. Trong mỗi trận đấu, hai đội năm người cố gắng phá hủy cơ sở của đối phương, sử dụng những nhân vật có thể bao gồm quỷ, nhện và ma lạnh.
Đầu tháng này, đội của OpenAI, OpenAI Five, đã thi đấu và đánh bại một đội chuyên nghiệp giữa 1% hàng đầu trên bảng xếp hạng toàn cầu của Dota 2. Cuộc đối đầu đó đơn giản hóa một số đặc điểm của trò chơi—ví dụ, bằng cách hạn chế cả hai đội đều sử dụng những nhân vật giống nhau. Nhưng Greg Brockman, Giám đốc công nghệ và cộng sự sáng lập của OpenAI, tin rằng các bot có thể sẵn sàng cho một trận đấu đầy đủ với những chuyên gia ở ngoại ô cuộc thi Vancouver sau hai tháng. "Chúng tôi đã thấy xuất hiện những động tác cấp độ chuyên nghiệp từ hệ thống này," ông nói.

Đó là một tuyên bố táo bạo. Đánh với orcs và warlocks có vẻ ít trí óc hơn so với cờ vua hoặc Go, những trò chơi mà máy tính đã đánh bại con người hàng đầu vào năm 1997 và 2016 tương ứng. Nhưng trò chơi video phức tạp như Dota 2 thì thực sự khó khăn hơn cho các hệ thống AI, theo Dave Churchill, một giáo sư tại Đại học Memorial, St. John's, Canada. Đó là lý do tại sao Alphabet's DeepMind, người đã tạo ra phần mềm AlphaGo làm nên lịch sử bằng cách đánh bại một nhà vô địch Go vào năm 2016, đang làm việc trên StarCraft 2, một trò chơi video tương tự khó khăn.
Dota và StarCraft rất khác nhau, nhưng cả hai đều khó đối với AI vì hành động diễn ra trên một bảng lớn hơn nhiều, nơi không phải tất cả các bước đi của đối thủ đều rõ ràng, như trong cờ vua hoặc Go. Trò chơi video phức tạp cũng đòi hỏi người chơi phải đưa ra nhiều quyết định, nhanh chóng hơn. Một người chơi cờ vua có, trung bình, khoảng 35 bước đi có thể thực hiện bất kỳ lúc nào, và một người chơi Go có 250. OpenAI nói rằng mỗi bot trong đội của họ phải chọn giữa trung bình 1.000 hành động hợp lệ mỗi phần tám giây. Những trận Dota 2 thường kéo dài khoảng 45 phút. "Những trò chơi này có nhiều đặc điểm tương tự với các tình huống thế giới thực hơn là cờ vua và Go," Churchill nói. OpenAI nói rằng thuật toán Dota 2 của họ có thể được điều chỉnh để giúp robot học cách thực hiện các nhiệm vụ phức tạp, ví dụ như.
OpenAI Five đã học cách chơi Dota 2 bằng cách đấu với bản sao của chính nó hàng triệu lần. Phần mềm được xây dựng dựa trên một kỹ thuật gọi là học củng cố, trong đó phần mềm sử dụng thử nghiệm và lỗi để khám phá những hành động nào sẽ tối đa hóa một phần thưởng ảo. Trong trường hợp của OpenAI Five, phần thưởng là sự kết hợp của các thống kê trò chơi do các nhà nghiên cứu OpenAI chọn để tạo ra kỹ năng ngày càng cải thiện.

Mặc dù học củng cố được truyền cảm hứng từ nghiên cứu về cách động vật và con người học, phiên bản nhân tạo lại ít hiệu quả hơn nhiều. Quá trình đào tạo của OpenAI Five sử dụng dịch vụ máy tính đám mây của Google, chiếm 128,000 bộ xử lý máy tính thông thường và 256 bộ xử lý đồ họa, là các vi mạch quan trọng cho các thí nghiệm học máy lớn, trong vài tuần liền. Các bộ xử lý thông thường thực hiện công việc chạy trò chơi, tạo dữ liệu đào tạo cho các thuật toán học, được cung cấp bởi các bộ xử lý đồ họa. Mỗi ngày, OpenAI Five chơi tương đương với 180 năm của Dota 2.
Không có con người nào có 180 năm để học một trò chơi video. Thực tế, một số nhà nghiên cứu AI cho rằng học củng cố quá không hiệu quả để hữu ích ngoài các tình huống giả định như trò chơi. Nhưng dự án OpenAI thể hiện rằng nếu bạn có thể đặt nhiều công suất tính toán vào các thuật toán hiện nay, chúng có thể làm nhiều hơn những gì mọi người mong đợi, Brockman khẳng định.
Bot của OpenAI không chơi giống như con người. Họ nhận biết trò chơi như một dòng số mô tả các khía cạnh khác nhau của trò chơi, thay vì bằng cách giải mã hình ảnh hiển thị, ví dụ. Họ có thể phản ứng nhanh hơn so với người chơi.
Nếu OpenAI Five chiến thắng tại Vancouver, những sự khác biệt đó, và bất kỳ điều chỉnh nào khác được thực hiện để thích nghi với bot, có thể khiến một số nhà nghiên cứu AI cho rằng đó không phải là một trận đấu công bằng. Churchill nói rằng bất kỳ chiến thắng nào trong một nhiệm vụ phức tạp như vậy đều có ý nghĩa, nhưng quy mô của đột phá sẽ phụ thuộc vào chi tiết phương pháp. Cách duy nhất để tránh mọi tranh cãi, ông đùa, là một trận đấu trong đó một robot ngồi tại một máy tính và điều khiển bàn phím và chuột. Brockman nói rằng ông sẽ đánh giá sự thành công của bot dựa trên việc các game thủ chuyên nghiệp có chấp nhận chúng là đối thủ đáng kể hay không.
Nếu các bot chiến thắng, thành tựu sẽ tất yếu được so sánh với DeepMind và công việc của họ về Go. Brockman nói rằng ông không đua với DeepMind để đặt ra dấu mốc lớn tiếp theo trong cuộc đua giữa máy tính và con người. "Chúng tôi đang khám phá học máy và trí tuệ nhân tạo cùng nhau, cố gắng xem những công nghệ này có khả năng gì," Brockman nói.
Những câu chuyện tuyệt vời khác từ MYTOUR
- Bên trong vụ bê bối lớn nhất thế giới crypto
- Cuối cùng, một hệ thống đánh giá thực tế cho công nghệ tự lái
- Những rủi ro tiềm ẩn của việc hút carbon từ khí quyển
- Star Wars và cuộc chiến của văn hóa fan ngày càng độc hại hơn
- Gặp Germán Garmendia, ngôi sao YouTube bình thường một cách quyết liệt muốn có tất cả
- Tìm kiếm thêm? Đăng ký nhận bản tin hàng ngày của chúng tôi và không bao giờ bỏ lỡ những câu chuyện mới và tuyệt vời nhất của chúng tôi
