Phát hiện này không chỉ làm dấy lên lo ngại về độ tin cậy của AI trong lĩnh vực y tế mà còn mở ra một câu hỏi thú vị: Trong tương lai, liệu chúng ta có cần đến những "bác sĩ thần kinh" chuyên điều trị cho trí tuệ nhân tạo hay không?
Trí tuệ nhân tạo đã và đang trở thành một phần không thể thiếu trong ngành y tế, hỗ trợ bác sĩ trong việc chẩn đoán bệnh nhanh chóng và chính xác hơn. AI giúp phân tích dữ liệu y tế, đọc X-quang, phát hiện dấu hiệu bất thường từ trước khi con người nhận thấy. Tuy nhiên, một nghiên cứu được công bố trên BMJ vào ngày 20/12/2024 đã đặt ra một câu hỏi gây bất ngờ: Liệu AI có thể bị "lão hóa" và mất khả năng tư duy giống con người?

Các nhà nghiên cứu đã tiến hành kiểm tra một số chatbot AI nổi tiếng như của OpenAI, Sonnet của Anthropic, và Gemini của Alphabet bằng bài kiểm tra Montreal Cognitive Assessment (MoCA). Đây là công cụ dùng để chẩn đoán suy giảm nhận thức trong các bệnh như Alzheimer và chứng mất trí nhớ. Bài kiểm tra yêu cầu các đối tượng thực hiện những nhiệm vụ như vẽ đồng hồ với thời gian chính xác, trừ 7 liên tiếp từ 100, ghi nhớ từ ngữ trong danh sách, và nhiều bài tập đánh giá sự linh hoạt trong tư duy.
Kết quả nghiên cứu khiến nhiều người bất ngờ. -4, phiên bản mới nhất của OpenAI, đạt 26/30 điểm, tương đương với người không có dấu hiệu suy giảm nhận thức. Tuy nhiên, khi thử nghiệm trên các mô hình cũ hơn, điểm số giảm mạnh. Gemini 1.0 chỉ đạt 16/30, cho thấy sự suy giảm trí tuệ theo thời gian ở các chatbot AI. Mặc dù các mô hình AI thể hiện tốt trong các bài tập liên quan đến ngôn ngữ và chú ý, chúng lại gặp khó khăn lớn khi thực hiện các nhiệm vụ yêu cầu tư duy trừu tượng và kỹ năng không gian.
Điều này gây ra một vấn đề quan trọng trong việc áp dụng AI vào lĩnh vực y tế. Nếu AI có thể gặp khó khăn trong việc xử lý thông tin theo thời gian, hoặc thậm chí mất trí nhớ, thì việc sử dụng chúng trong các quyết định quan trọng như chẩn đoán bệnh hay hỗ trợ phẫu thuật sẽ trở nên nguy hiểm hơn chúng ta tưởng.
Các tác giả của nghiên cứu nhấn mạnh rằng đây chỉ là những phát hiện ban đầu và không thể so sánh trực tiếp AI với trí óc con người. Tuy nhiên, họ cảnh báo rằng các mô hình AI hiện tại vẫn có những "điểm yếu đáng kể" trong các nhiệm vụ đòi hỏi khả năng suy luận trực quan và chức năng điều hành – những yếu tố vô cùng quan trọng trong y khoa lâm sàng.
Phát hiện này không chỉ gợi mở những câu hỏi về độ tin cậy của AI trong ngành y tế, mà còn dẫn đến một viễn cảnh thú vị: Liệu trong tương lai, có phải chúng ta sẽ cần đến những "bác sĩ thần kinh" chuyên điều trị cho trí tuệ nhân tạo?
