Ôi tuyệt vời, bây giờ các nhà khoa học đang dạy Trí tuệ Nhân tạo cách tránh bị truy đuổi
Bạn có biết không Neural sẽ xuất hiện trong mùa thu này không? Cùng với đội ngũ chuyên gia tuyệt vời, chúng tôi sẽ khám phá tương lai của Trí tuệ Nhân tạo trong Hội nghị TNW 2021. Đảm bảo đặt vé trực tuyến của bạn ngay bây giờ!
Một nhà khoa học từ Đại học Bắc Kinh gần đây đã công bố một bài nghiên cứu trước mô tả một hệ thống dựa trên trò chơi video được thiết kế để dạy Trí tuệ Nhân tạo tránh bị truy đuổi.
Tên của trò chơi là StarCraft II, hoặc chính xác hơn, một trò chơi nhỏ được thiết kế trong môi trường đào tạo SCII. Và mục tiêu là đảo ngược một mô hình phổ biến để khám phá phương pháp đào tạo Trí tuệ Nhân tạo mới.
Ở phía trước: Hầu hết các nghiên cứu trong thể loại truy đuổi-điều tra của Trí tuệ Nhân tạo và lý thuyết trò chơi liên quan đến việc dạy máy móc khám phá các không gian. Vì hầu hết quá trình đào tạo Trí tuệ Nhân tạo liên quan đến một hệ thống thưởng cho máy móc khi đạt được một mục tiêu, các nhà phát triển thường sử dụng trò chơi hóa như một động lực cho quá trình đào tạo.
Nói cách khác: bạn không thể đơn giản đặt một robot trong một phòng và nói "làm cái gì đó." Bạn phải đặt ra mục tiêu và lý do để nó đạt được chúng. Vì vậy, các nhà nghiên cứu thiết kế Trí tuệ Nhân tạo để tự nhiên tìm kiếm phần thưởng.
Hội nghị TNW 2024 - Kêu gọi tất cả các Startups tham gia vào ngày 20-21 tháng 6
Trình bày Startup của bạn trước các nhà đầu tư, người thay đổi và khách hàng tiềm năng với gói Startup được tinh chỉnh của chúng tôi.
Môi trường đào tạo thám hiểm truyền thống giao cho một tác nhân Trí tuệ Nhân tạo nhiệm vụ làm thay đổi các mô hình kỹ thuật số để khám phá một không gian cho đến khi hoàn thành mục tiêu hoặc tìm thấy phần thưởng của mình.
Nó hoạt động giống như trò chơi Pac Man: Trí tuệ Nhân tạo phải di chuyển xung quanh một môi trường cho đến khi nó ăn hết tất cả những viên bi thưởng.
Ở phía sau: Kể từ khi hệ thống Trí tuệ Nhân tạo của DeepMind vượt qua cả Cờ vua và Cờ Gô, SCII đã trở thành môi trường đào tạo phổ biến cho Trí tuệ Nhân tạo đối đầu. Đó là một trò chơi tự nhiên đưa người chơi, Trí tuệ Nhân tạo hoặc sự kết hợp của người chơi và Trí tuệ Nhân tạo đối mặt với nhau.
Nhưng quan trọng hơn, DeepMind và các tổ chức nghiên cứu khác đã làm công việc khó khăn để biến mã nguồn của trò chơi thành một sân chơi Trí tuệ Nhân tạo với nhiều trò chơi nhỏ cho phép các nhà phát triển tập trung vào công việc của họ.
Nhà nghiên cứu Xun Huang, nhà khoa học từ Đại học Bắc Kinh đã điều tra một mô hình "theo đuổi-tránh bị đuổi" để đào tạo mô hình Trí tuệ Nhân tạo. Nhưng phát hiện ra rằng mô hình SCII có một số hạn chế ức chế.
Trong phiên bản đã tích hợp của trò chơi đuổi bắt và trốn chạy, bạn chỉ có thể giao việc kiểm soát của những người đuổi cho trí tuệ nhân tạo.
Cài đặt cơ bản bao gồm ba nhân vật săn đuổi (được đại diện bởi các đơn vị loại lính trong trò chơi) và 25 nhân vật trốn chạy (được đại diện bởi người ngoài hành tinh trong trò chơi). Cũng có một chế độ sử dụng "sương mù chiến tranh" để làm mờ bản đồ, làm cho việc đuổi bắt và tiêu diệt những người trốn trở nên khó khăn hơn, nhưng nghiên cứu chỉ ra đó là một chế độ 1V1.
Một cách hài hước, hành vi cơ bản cho 25 đơn vị xâm lược là giữ vị trí đóng băng ở bất kỳ nơi nào họ xuất hiện và sau đó tấn công những người đuổi khi nhìn thấy. Vì những người đuổi yếu đuối hơn nhiều so với những người đuổi, điều này dẫn đến việc tất cả những người trốn chạy bị giết ngay sau khi bị phát hiện.
Bài báo của Huang mô tả một mô hình đào tạo Trí tuệ Nhân tạo trong môi trường SCII tập trung vào việc đào tạo Trí tuệ Nhân tạo để tránh những người đuổi. Trong phiên bản của họ, Trí tuệ Nhân tạo cố gắng thoát vào sương mù chiến tranh để tránh bị bắt và giết.
Quan điểm nhanh: Đây là nghiên cứu hấp dẫn sử dụng trò chơi điện tử có thể có tác động thực tế rộng lớn. Các tổ chức quân sự tiên tiến nhất thế giới sử dụng trò chơi điện tử để đào tạo con người.
Và nhà phát triển Trí tuệ Nhân tạo sử dụng các môi trường đào tạo này để huấn luyện Trí tuệ Nhân tạo cho cuộc sống bên trong một robot thực tế. Một nhà phát triển có thể giới thiệu một mô hình vào một trò chơi chỉ chạy vào tường đầu tiên mà nó thấy trong vài trăm lần lặp đầu tiên, nhưng sau vài nghìn hoặc vài triệu lần lặp, mô hình thường sẽ hiểu được. Nó giúp tiết kiệm nhiều gạch để đào tạo chúng trong một trò chơi trước.
Nếu áp dụng điều đó ở đây, công việc của Huang có vẻ hứng thú - nhưng khó có thể không tưởng tượng ra một số cách đáng sợ mà Trí tuệ Nhân tạo có thể sử dụng khả năng chạy trốn được đào tạo cao của mình.
Các robot tương lai đã làm gì? Tại sao mọi người đang đuổi theo chúng?
Ngược lại, thông tin chúng ta thu được từ cái nhìn mới của Trí tuệ Nhân tạo về nghệ thuật đuổi bắt và trốn chạy có thể giúp con người trở nên giỏi hơn cả hai.
Đọc toàn bộ bài báo tại đây trên arXiv.
