Báo cáo từ Google DeepMind cho thấy hệ thống AI Gemini phải tiêu tốn 813 giờ đồng hồ, trải qua nhiều tình huống khó khăn và những khoảnh khắc "mất kiểm soát" khi cố gắng hoàn thành Pokémon Blue - thời gian vượt xa khả năng của game thủ phổ thông.
Hành trình chinh phục tựa game Pokémon Blue của Gemini AI không hề dễ dàng khi hệ thống này phải đầu tư hơn 800 giờ liên tục.
Gemini AI và thử nghiệm "Gemini Plays Pokémon" đầy tham vọng
Google DeepMind vừa công bố nghiên cứu đặc biệt về Gemini AI trong dự án Gemini Plays Pokémon. Được phát triển bởi Joel Zhang (không trực thuộc Google), dự án này nhằm đánh giá năng lực xử lý tình huống của AI trong môi trường game nhập vai đầy phức tạp.
Dự án thử nghiệm sử dụng AI Gemini 2.5 Pro để tự động trải nghiệm tựa game huyền thoại Pokémon Blue - phiên bản đầu tiên đặt nền móng cho series đình đám. Nghiên cứu nhằm đánh giá khả năng phân tích tình huống và đưa ra quyết định của trí tuệ nhân tạo trước các thử thách đa dạng trong game.

Nghiên cứu gần đây của Google DeepMind công bố hiện tượng Gemini AI rơi vào trạng thái "khủng hoảng" trong quá trình chơi Pokémon Blue.
Hiện tượng "Agent Panic" - Khi AI trải nghiệm cảm xúc "quá tải"
Kết quả nghiên cứu mô tả trạng thái "Agent Panic" - tương tự phản ứng hoảng loạn của con người khi đối mặt với quá nhiều mối nguy hiểm. AI thể hiện hành vi thiếu logic như cố gắng thoát khỏi hang động liên tục khi gặp nguy hiểm, hay lạm dụng kỹ năng DIG và vật phẩm ESCAPE ROPE một cách thiếu kiểm soát.
Khi các Pokémon trong đội hình gần cạn kiệt sinh lực, AI thường phản ứng thiếu kiểm soát bằng cách vội vã rút lui hoặc tập trung hồi phục mà bỏ qua việc lên kế hoạch di chuyển hay chiến thuật tối ưu. Đáng chú ý, trong những tình huống căng thẳng, hệ thống còn không sử dụng công cụ định hướng (pathfinder) - yếu tố then chốt giúp điều hướng trong game, khiến quá trình hoàn thành mục tiêu gặp nhiều trở ngại.

"Gemini Plays Pokemon" là dự án được phát triển bởi Joel Zhang, một lập trình viên độc lập không liên quan đến Google.
Thời gian hoàn thành game vượt xa mức bình thường
Gemini AI cần tới 813 giờ để kết thúc Pokémon Blue - con số này gấp hàng chục lần so với thời gian trung bình 20-30 giờ của game thủ phổ thông. Khoảng cách lớn này phản ánh những giới hạn rõ rệt của AI trong việc bắt chước khả năng tư duy và phản ứng linh hoạt như con người.
Mặc dù khá thú vị khi quan sát AI rơi vào trạng thái "quá tải" với những hành vi bất thường, trường hợp của Gemini thực sự mang lại những hiểu biết mới cho ngành nghiên cứu AI, nhất là trong lĩnh vực phát triển khả năng xử lý cảm xúc và tình huống phức tạp.
Giá trị nghiên cứu và tiềm năng phát triển AI trong tương lai
Hiện tượng "Agent Panic" ở Gemini AI cho thấy những thách thức quan trọng trong việc phát triển hệ thống AI có khả năng tư duy mềm dẻo, xử lý cảm xúc và đưa ra quyết định tối ưu trong môi trường đa biến và không ổn định. Đây là kinh nghiệm quý báu giúp các nhà khoa học cải thiện thuật toán, nâng cao khả năng thích ứng và phản hồi của AI sau này.

Quá trình chơi game ghi nhận nhiều tình huống AI thể hiện các dấu hiệu "giống với trạng thái hoảng loạn ở người".
Khoảng cách lớn về thời gian hoàn thành game giữa AI và con người cho thấy hành trình phát triển trí tuệ nhân tạo vẫn còn nhiều chặng đường phía trước. Dù vậy, với tốc độ phát triển công nghệ hiện nay, những bước tiến trong tương lai sẽ giúp AI dần hoàn thiện và tiến gần hơn đến khả năng tư duy như con người.
Gemini Plays Pokémon không chỉ là một thí nghiệm thú vị khi quan sát AI "mất kiểm soát cảm xúc", mà còn là bằng chứng sống động về cả thách thức lẫn tiềm năng của ngành AI hiện đại. Dự án này chính là nền tảng quan trọng để xây dựng những hệ thống AI thông minh hơn, linh hoạt hơn và hiệu quả hơn trong những năm tới.
