Cách Trí Tuệ Nhân Tạo Có Thể Nâng Cao Trải Nghiệm Game Cho Tất Cả Người Chơi

Khi Google công bố Dự Án Gameface, công ty tự hào giới thiệu một chiếc chuột chơi game được tích hợp trí tuệ nhân tạo không cần sử dụng tay, theo thông báo của nó, "cho phép người ta kiểm soát con trỏ máy tính bằng cách sử dụng chuyển động đầu và biểu cảm khuôn mặt của họ." Mặc dù đây có thể không phải là công cụ chơi game dựa trên trí tuệ nhân tạo đầu tiên, nhưng nó chắc chắn là một trong những sản phẩm đầu tiên đưa trí tuệ nhân tạo vào tay người chơi, thay vì nhà phát triển.
Dự án được lấy cảm hứng từ Lance Carr, một người chơi game trực tuyến bị tê liệt cổ điển sử dụng chuột theo dõi đầu làm phần của bộ thiết bị chơi game của mình. Sau khi thiết bị hiện tại của anh ấy bị mất trong một vụ hỏa hoạn, Google đã bước vào để tạo ra một giải pháp thay thế có chi phí thấp, có thể được cấu hình cao và nguồn mở, được động lực bởi học máy. Mặc dù sự tồn tại rộng lớn của trí tuệ nhân tạo đang gây ra tranh cãi, chúng tôi đã nghiên cứu để xem liệu trí tuệ nhân tạo, khi được sử dụng với mục đích tốt, có thể là tương lai của khả năng tiếp cận trong trò chơi không.
Quan trọng là định nghĩa Trí Tuệ Nhân Tạo và Học Máy để hiểu rõ cách chúng hoạt động trong Gameface. Khi chúng ta sử dụng các thuật ngữ "Trí Tuệ Nhân Tạo" và "Học Máy," chúng ta đang tham chiếu đến cả hai thứ giống và khác nhau.
"Trí tuệ nhân tạo là một khái niệm," Laurence Moroney, chuyên gia quảng bá trí tuệ nhân tạo tại Google và một trong những bộ óc đằng sau Gameface, nói với MYTOUR. "Học máy là một kỹ thuật bạn sử dụng để triển khai khái niệm đó."
Học máy, sau đó, nằm trong khái niệm của trí tuệ nhân tạo, cùng với các triển khai như mô hình ngôn ngữ lớn. Nhưng nơi các ứng dụng quen thuộc như ChatGPT của OpenAI và Stable Diffusion của StabilityAI là các phiên bản lặp lại, học máy được đặc trưng bởi việc học và thích ứng mà không cần hướng dẫn, rút ra những suy luận từ các mẫu có thể đọc được.
Moroney giải thích cách điều này được áp dụng vào Gameface trong một loạt các mô hình học máy. "Mô hình đầu tiên là có khả năng phát hiện vị trí khuôn mặt trong một hình ảnh," anh ấy nói. "Mô hình thứ hai là, khi bạn có một hình ảnh của khuôn mặt, có khả năng hiểu nơi các điểm rõ ràng (mắt, mũi, tai, v.v.) nằm ở đâu."
Sau đó, một mô hình khác có thể ánh xạ và giải mã các cử chỉ từ những điểm đó, gán chúng vào đầu vào của chuột.
Đây là một triển khai của Trí Tuệ Nhân Tạo rõ ràng hỗ trợ, khác biệt với những triển khai thường được quảng bá là làm cho đầu vào của con người trở nên không cần thiết. Thực sự, đây là cách Moroney gợi ý Trí Tuệ Nhân Tạo được áp dụng tốt nhất, để mở rộng "khả năng của chúng ta để thực hiện những điều trước đây không khả thi."
Tâm trạng này mở rộng ra ngoài khả năng của Gameface làm cho trò chơi trở nên dễ tiếp cận hơn. Trí Tuệ Nhân Tạo, Moroney gợi ý, có thể có ảnh hưởng lớn đến khả năng tiếp cận của người chơi, nhưng cũng đối với cách nhà phát triển tạo ra các giải pháp tiếp cận.
"Bất cứ điều gì giúp nhà phát triển hiệu quả hơn đáng kể trong việc giải quyết các loại vấn đề trước đây là không khả thi," anh ấy nói, "chỉ có thể mang lại lợi ích trong lĩnh vực tiếp cận, hoặc bất kỳ lĩnh vực nào khác."
Điều này là điều mà các nhà phát triển đã bắt đầu hiểu. Artem Koblov, giám đốc sáng tạo của Perelesoq, cho biết anh ấy muốn thấy "nhiều nguồn lực hướng dẫn để giải quyết các công việc hàng ngày, thay vì sáng tạo đổi mới."

Bằng cách làm điều này, Trí Tuệ Nhân Tạo có thể hỗ trợ trong các quy trình kỹ thuật tốn thời gian. Với các ứng dụng phù hợp, Trí Tuệ Nhân Tạo có thể tạo ra một chu kỳ phát triển linh hoạt hơn, cho phép nó không chỉ giúp đỡ trong việc triển khai cơ cấu cơ bản của các giải pháp tiếp cận mà còn để lại thời gian cho nhà phát triển để xem xét chúng.
“Là một nhà phát triển, bạn muốn có càng nhiều công cụ có thể giúp bạn làm công việc của mình dễ dàng hơn,” Conor Bradley, giám đốc sáng tạo của Soft Leaf Studios nói. Anh ấy chỉ ra sự tiến bộ trong các triển khai hiện tại của Trí Tuệ Nhân Tạo trong tiếp cận, bao gồm “chuyển đổi văn bản thành tiếng và ngược lại trong thời gian thực, và nhận diện giọng nói và hình ảnh.” Anh ấy cũng nhìn nhận tiềm năng cho sự phát triển trong tương lai. “Đến lúc đó, tôi có thể thấy nhiều trò chơi sử dụng những công cụ Trí Tuệ Nhân Tạo mạnh mẽ này để làm cho trò chơi của chúng tôi trở nên dễ tiếp cận hơn.”
Koblov tin rằng có thể đi xa hơn nữa. Anh ấy muốn thấy Trí Tuệ Nhân Tạo được đào tạo trên các mô hình cụ thể để tạo ra một khung tiếp cận cơ bản và linh hoạt có thể được chèn vào trò chơi. “Khung việc này sẽ điều chỉnh các khía cạnh hình ảnh, âm thanh và tương tác của trò chơi,” anh ấy nói. “Nói cách khác, các nhà phát triển nhỏ như chúng tôi sẽ không cần thực hiện nghiên cứu đắt đỏ, phát triển giải pháp duy nhất và trải qua nhiều lần kiểm thử trên chính họ.”
Bradley khuyến cáo sự thận trọng khi lấy đi sự ưu tiên từ đầu vào của con người. Khi được hỏi liệu Trí Tuệ Nhân Tạo có thể chứng minh là một sự hỗ trợ hay làm mất tập trung khỏi những nỗ lực tiếp cận hiện tại, anh ấy nói rằng anh ấy lạc quan về tiềm năng của nó, nhưng nhấn mạnh rằng Trí Tuệ Nhân Tạo không phải là một lối tắt.
“Bạn không thể nói, ‘Trí Tuệ Nhân Tạo, làm cho trò chơi của tôi dễ tiếp cận!’ và voilà, bạn bây giờ có trò chơi dễ tiếp cận nhất trong năm,” anh ấy nói. “Chúng ta cần người chơi, bao gồm những người thuộc cộng đồng tàn tật và đa dạng thần kinh, để kiểm thử trò chơi của chúng ta. Cuối cùng, một con người sẽ chơi trò chơi của bạn, không phải một máy.”
Trong khi Koblov tin rằng Trí Tuệ Nhân Tạo có thể có giá trị trong việc triển khai và kiểm thử tính năng tiếp cận, anh ấy nhận thức rằng việc nghĩ về Trí Tuệ Nhân Tạo đòi hỏi “tư duy thêm vào,” thay vì một “phương pháp thay thế.”
Nhưng việc lẫn lộn giữa các công cụ tạo nội dung sáng tạo, đẩy lùi nỗi sợ hãi về sự thừa thãi của con người với loại triển khai Trí Tuệ Nhân Tạo giúp đỡ tính khả dụng là, theo Moroney, “Thực sự nguy hiểm.” Anh ấy tiếp tục, “Nếu chúng ta sẽ là những người lớn trong phòng khi nói đến Trí Tuệ Nhân Tạo, chúng ta phải nhận ra sự hào nhoáng và theo đuổi mốt.”
Điều này làm cho sự rõ ràng và minh bạch về khả năng của Trí Tuệ Nhân Tạo trở nên quan trọng hơn bao giờ hết, đặc biệt là trong mối quan hệ của nó với khả năng tiếp cận. Đó không phải là một cây đũa thần kỳ. “Trí Tuệ Nhân Tạo và Học Máy đang làm rất tốt cho đến các bản phát hành gần đây,” Moroney nói. “Bây giờ chúng đã quay trở lại trong chu kỳ hào nhoáng.”
Trí Tuệ Nhân Tạo có thể là một công cụ xuất sắc cho nhà phát triển, nhưng họ phải duy trì cam kết với tính khả dụng trong suốt quá trình, có Trí Tuệ Nhân Tạo hay không. Cuối cùng, như Bradley nói, “Vào cuối ngày, vẫn là trách nhiệm của nhà phát triển muốn làm cho trò chơi của họ dễ tiếp cận từ thiết kế.”
Sự tiến triển dần dần của Trí Tuệ Nhân Tạo hiển nhiên trong Gameface. Nhưng một dự án khác cho thấy cách tính khả dụng được hỗ trợ bằng Trí Tuệ Nhân Tạo có thể được triển khai ở mức độ rộng lớn hơn. Minecraft Access là một mod mục tiêu làm cho Minecraft trở nên dễ tiếp cận đối với người chơi mù và có vấn đề về thị giác. Logic, một phần của đội ngũ đứng sau mod, cho biết trên MYTOUR làm thế nào một bộ công cụ Trí Tuệ Nhân Tạo, bao gồm ChatGPT và Tensor Flow của Google, đang giúp đỡ dự án.
“Chúng tôi hy vọng Trí Tuệ Nhân Tạo có thể điền vào … ngữ cảnh hình ảnh cho người chơi mù và thấp thị bằng cách cung cấp thông tin về thế giới khi nó cần thiết hoặc theo yêu cầu,” Logic nói.
Đặc biệt hứng thú là khả năng của Trí Tuệ Nhân Tạo không chỉ làm tăng cường tính khả dụng, mà còn học hỏi một cách tích cực về những gì một người chơi cần. Điều này sẽ đặc biệt hữu ích cho các ứng dụng rộng lớn trong tính khả dụng, đặc biệt là khi có nhiều lớp phổ cảm mà tạo nên khuyết tật và cá nhân hóa từng nhu cầu của người chơi.
Tuy nhiên, chúng ta cần hạn chế kỳ vọng của mình. Mặc dù những triển khai gần đây đã chứng minh là hứa hẹn, và có thể làm cho tương lai trở nên rõ ràng, vẫn còn những rào cản đáng kể. Ở giai đoạn phát triển hiện tại, Minecraft Access đòi hỏi nhiều chương trình để hoạt động, điều Logic nhận thức làm cho nó trở nên ít dễ tiếp cận hơn nếu có thể.
“Người dùng bình thường sẽ không muốn thu thập một đám chương trình từ các phần khác nhau trên web,” Logic nói.
Tương tự, Ben Green, một game thủ tàn tật, thấy tiềm năng của Gameface thú vị nhưng lo lắng về đa dạng trong dữ liệu. Nó có thể “nhận diện rất nhiều khuôn mặt,” anh ấy nói. “Nhưng một số người có sự khác biệt về khuôn mặt, như máy thở của tôi, hoặc các đặc điểm khuôn mặt không đối xứng, có thể được đại diện rất ít, hoặc không đại diện.”
Khi được hỏi về điều này, Miguel de Andrés-Clavera, người dẫn đầu nhóm phát triển Dự Án Gameface, nói, “Chúng tôi quyết định tạo ra một chức năng để người dùng tùy chỉnh những biểu cảm họ sử dụng để kiểm soát chuột.” Điều này bao gồm khả năng tùy chỉnh cường độ các cử chỉ cho các nhu cầu khác nhau. Anh ấy tiếp tục, “Dù vậy, chúng tôi luôn tìm cách để nâng cao tính khả dụng của công nghệ cho nhiều người hơn. Hy vọng của chúng tôi là qua thời gian, Dự Án Gameface sẽ tiếp tục cải thiện và trở nên hữu ích hơn nữa.”
Ngay cả với những lưu ý này, thú vị khi thấy mọi người đặt niềm hi vọng vào vai trò của Trí Tuệ Nhân Tạo trong tính khả dụng. Khi chúng ta có thể phân biệt giữa các ứng dụng không đạo đức của Trí Tuệ Nhân Tạo tạo nội dung và các công cụ và triển khai Trí Tuệ Nhân Tạo có ý nghĩa có thể giúp người giải quyết vấn đề và mang lại lợi ích cho người khác, có đủ lý do để lạc quan—với sự hiểu biết rằng giá trị thực sự của Trí Tuệ Nhân Tạo liên quan đến khả năng của chúng ta để làm cho nó hoạt động cho chúng ta.
Tương lai của Trí Tuệ Nhân Tạo là mơ hồ, nhưng nó mang theo tiềm năng để làm lợi cho người chơi cá nhân và ngành công nghiệp nói chung. Việc sử dụng nó đòi hỏi sự cẩn trọng, và chúng ta có thể gặp phải những rủi ro, nhưng có mọi lý do để tin rằng triển khai cẩn thận của Trí Tuệ Nhân Tạo có thể đóng góp vào một cảnh đua game mà bao gồm một phổ rộng lớn hơn của người chơi.
Đó là thế giới mà Moroney muốn sống trong đó: “một thế giới nơi những người như Lance không bị hạn chế vì các giải pháp kỹ thuật không khả thi, mà ngược lại là một thế giới nơi nhà phát triển có siêu năng lực để xây dựng giải pháp để cho phép anh ấy kết nối với thế giới một cách dễ dàng.”
