DeepMind Đánh Bại Chuyên Gia ở StarCraft - Một Thành Tích Mới Cho Bots

Tháng trước tại London, một đội từ đơn vị nghiên cứu trí tuệ nhân tạo của Alphabet có trụ sở tại Anh, DeepMind, một cách êm đềm đặt một dấu mốc mới trong cuộc đua giữa con người và máy tính. Vào thứ Năm, họ công bố thành tựu này trong một buổi trực tiếp trên YouTube kéo dài ba giờ, trong đó người ngoài hành tinh và robot chiến đấu đến chết.
Cuộc trình diễn của DeepMind cho thấy trí tuệ nhân tạo AlphaStar của họ đánh bại một người chơi chuyên nghiệp trong trò chơi video chiến thuật thời gian thực phức tạp StarCraft II. Nhà vô địch của nhân loại, Grzegorz Komincz, 25 tuổi, người Ba Lan, đã thua 5-0. Phần mềm có sức mạnh từ học máy dường như đã khám phá ra những chiến thuật mà các chuyên gia chơi cho hàng triệu đô la thưởng mỗi năm trong một trong những trò chơi e-sports có thu nhập cao nhất. “Đó khác biệt so với bất kỳ StarCraft nào mà tôi đã chơi," Komincz, được biết đến chuyên nghiệp với tên là MaNa, nói.
Chiến tích của DeepMind là sự kỳ công phức tạp nhất cho đến nay trong một chuỗi cuộc đua trong đó máy tính đã đánh bại con người hàng đầu ở các trò chơi. Cờ vua đã chấp nhận sự thất bại vào năm 1994, cờ vua vào năm 1997, và bot trước đó của DeepMind là AlphaGo đã trở thành người đầu tiên đánh bại một nhà vô địch ở trò chơi cờ Go vào năm 2016. Bot StarCraft là người chơi game AI mạnh mẽ nhất cho đến nay; nó cũng có thể là điều ít người mong đợi nhất.
AlphaStar xuất hiện khoảng sáu năm sau khi cuộc bùng nổ trí tuệ nhân tạo được kích thích bởi sự cải tiến trong công nghệ học máy, bao gồm một số từ các nhà nghiên cứu của DeepMind. Trong khi chiến thắng của AlphaGo vào năm 2016 là đầy ấn tượng—các chuyên gia Go đã nghĩ rằng thời điểm đó ít nhất còn một thập kỷ—chiến thắng của AlphaStar có vẻ giống như theo đúng lịch trình. Đến nay, rõ ràng rằng với đủ dữ liệu và công suất tính toán, học máy có thể chinh phục những vấn đề phức tạp, nhưng cụ thể.
Mark Riedl, giáo sư đồng hành tại Georgia Tech, cho biết tin tức vào thứ Năm là thú vị nhưng không khiến người ta nổi hứng thú. “Chúng ta đã đến một điểm mà chỉ là vấn đề thời gian,” ông nói. “Một cách nào đó, việc đánh bại con người trong trò chơi trở nên nhàm chán.”

Trò chơi video như StarCraft toán học phức tạp hơn cờ vua hoặc Go. Số lượng tư thế hợp lệ trên bảng cờ Go là một số 1 tiếp theo là 170 số 0, tương đương với StarCraft được ước lượng là một số 1 với ít nhất 270 số 0. Xây dựng và điều khiển đơn vị quân sự trong StarCraft đòi hỏi người chơi phải lựa chọn và thực hiện nhiều hành động hơn, và đưa ra quyết định mà không thể nhìn thấy mọi bước đi của đối thủ.
DeepMind vượt qua những khả năng cản trở cao đó với sự giúp đỡ từ những vi xử lý TPU mạnh mẽ mà Google phát minh để đẩy mạnh học máy. Nó điều chỉnh các thuật toán được phát triển để xử lý văn bản để giải quyết nhiệm vụ làm thế nào các hành động trên chiến trường dẫn đến chiến thắng. AlphaStar được đào tạo trong StarCraft với hồ sơ của nửa triệu trận đấu giữa con người, sau đó chơi liên tiếp với các bản sao cải tiến của chính nó trong một liên đấu ảo, theo một hình thức tiến hóa số học. Những bot xuất sắc nhất từ liên đấu đó đã tích lũy kinh nghiệm tương đương với khoảng 200 năm chơi game.
AlphaStar mà đánh bại MaNa chưa phải là đối thủ toàn diện của anh ấy. Hiện tại, bot chỉ có thể chơi là một trong ba chủng tộc ngoài hành tinh có sẵn trong StarCraft. Ngoài kinh nghiệm chơi game vô cùng dài đối với con người, phần mềm của DeepMind nhìn nhận trò chơi theo cách khác. Tầm nhìn của nó bao gồm mọi thứ có thể nhìn thấy trong trò chơi cùng một lúc, trong khi MaNa phải di chuyển xung quanh bản đồ để xem điều gì đang xảy ra. AlphaStar cũng có khả năng chính xác cao hơn khi điều khiển và nhắm mục tiêu các đơn vị so với một con người cầm chuột máy tính, mặc dù thời gian phản ứng của nó chậm hơn so với một game thủ chuyên nghiệp.
Mặc dù có những lưu ý đó, Riedl và các chuyên gia khác theo dõi vào thứ Năm nói chung đều hoan nghênh công việc của DeepMind. “Đó là ấn tượng cực kỳ,” Jie Tang, một nghiên cứu viên tại Viện nghiên cứu trí tuệ nhân tạo độc lập OpenAI làm việc trên bot chơi Dota 2, môn thể thao điện tử có giải thưởng lớn nhất thế giới, nói. Những pha nguy cơ chơi video như vậy có thể tạo ra những ứng dụng phụ có tiềm năng, ông nói. Thuật toán và mã nguồn mà OpenAI đã sử dụng để thách thức các game thủ Dota năm ngoái, với kết quả không đồng đều, đã được điều chỉnh để làm cho bàn tay robot linh hoạt hơn.

Tuy nhiên, AlphaStar làm nổi bật một hạn chế của các hệ thống học máy chuyên sâu hiện nay, theo lời Julian Togelius, giáo sư tại NYU và tác giả của một cuốn sách mới về trò chơi và trí tuệ nhân tạo. Không giống như đối thủ con người, nhà vô địch mới của DeepMind không thể chơi ở sức mạnh đầy đủ trên các bản đồ trò chơi khác nhau, hoặc như các chủng tộc ngoài hành tinh khác nhau trong trò chơi, mà không cần đào tạo tiếp theo rất nhiều. Cũng không thể chơi cờ, đánh cờ, hoặc các phiên bản trước của StarCraft.
Khả năng không thể xử lý ngay cả những bất ngờ nhỏ là một thách thức cho nhiều ứng dụng hy vọng của trí tuệ nhân tạo, như lái xe tự động hoặc bot linh hoạt mà các nhà nghiên cứu gọi là trí tuệ nhân tạo tổng quát, hay AGI. “Để đạt được chữ G trong AGI, chúng ta cần tiến xa hơn từng trò chơi cá nhân,” Togelius nói. Một cuộc chiến game giữa con người và máy tính có thể là một loại decathlon, với cờ, trò chơi video, và một kết thúc của Dungeons and Dragons.
Các hạn chế của trí tuệ nhân tạo chuyên sâu dường như đã được thể hiện khi MaNa chơi một trận đấu biểu diễn trực tiếp vào thứ Năm chống lại một phiên bản thử nghiệm của AlphaStar giới hạn trong cách nhìn nhận bản đồ trò chơi giống như một người chơi con người, một khu vực được thu phóng một lúc. Dữ liệu của DeepMind cho thấy nó gần như giỏi như phiên bản đã đánh bại MaNa qua năm trận.
Bot mới nhanh chóng tập hợp một đội quân mạnh mẽ đủ để đánh bại đối thủ con người của mình, nhưng MaNa sử dụng những chiến thuật thông minh và kinh nghiệm từ trận đấu 5-0 để đánh lừa lực lượng đối phương và giữ chặt. Sự trễ này mang lại cho anh ấy thời gian để xây dựng đơn vị của mình - và chiến thắng. “Khả năng thích ứng đó là điều chúng ta vẫn chưa thấy từ các hệ thống học máy,” Tang nói.
More Great MYTOUR Stories
- Có vẻ như Big Tech đang hợp nhất với Big Brother? Hơi giống như vậy
- Capture các vết tích trần trụ của máy vũ trụ
- Nếu côn trùng ăn được là tương lai, chúng ta nên nói về phân
- Thực tế vô hình của việc làm mẹ trên Instagram
- Bạn có cần một biển số xe số kỹ thuật số không? Một startup nghĩ vậy
- 👀 Tìm kiếm những thiết bị công nghệ mới nhất? Xem những lựa chọn của chúng tôi, hướng dẫn mua sắm và các ưu đãi tốt nhất quanh năm
- 📩 Muốn nhiều hơn? Đăng ký nhận bản tin hàng ngày của chúng tôi và đừng bao giờ bỏ lỡ những câu chuyện mới nhất và tuyệt vời nhất của chúng tôi
