Một nhóm nghiên cứu tại Mỹ mới đây đã công bố một công nghệ mới có khả năng chuyển hóa những gì con người nhìn thấy hoặc tưởng tượng thành mô tả bằng chữ, với độ chính xác vượt trội.
Công nghệ “mind captioning” đang gây xôn xao trong giới khoa học khi có thể chuyển đổi tín hiệu não bộ thành những câu mô tả chính xác về hình ảnh hoặc khung cảnh mà con người đang nghĩ đến. Đây là một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh, do nhóm nhà khoa học Mỹ công bố.
Hệ thống này có khả năng giải mã hoạt động não bộ và biến những gì con người thấy hoặc tưởng tượng trong đầu thành những câu mô tả bằng chữ, với độ chính xác cực kỳ ấn tượng.
Công trình nghiên cứu này đã được công bố trên tạp chí Science Advances, mở ra một tương lai mới trong việc khám phá cách thức não bộ con người nhận thức thế giới xung quanh. Đồng thời, công nghệ này cũng mang đến cơ hội ứng dụng trong việc hỗ trợ người mắc các rối loạn ngôn ngữ, ví dụ như sau khi bị đột quỵ.

Theo các nhà nghiên cứu tại Đại học California, Berkeley, kỹ thuật này sử dụng công nghệ chụp hình não không xâm lấn để ghi lại hoạt động thần kinh, sau đó áp dụng mô hình ngôn ngữ AI tiên tiến để dự đoán và mô tả chính xác những gì người tham gia đang nhìn thấy hoặc tưởng tượng.
“Hệ thống có thể dự đoán ở mức độ chi tiết rất cao những gì một người đang nhìn thấy. Đây là điều chưa từng có tiền lệ”, nhà khoa học thần kinh Alex Huth khẳng định.
Trong suốt hơn một thập kỷ, các nhà nghiên cứu đã cố gắng dự đoán hình ảnh hoặc âm thanh từ tín hiệu não. Tuy nhiên, việc chuyển đổi những nội dung phức tạp như video hoặc hình dạng trừu tượng thành ngôn ngữ vẫn là một thách thức lớn.
Các phương pháp trước đây chỉ có thể nhận diện các từ khóa riêng lẻ, thay vì toàn bộ bối cảnh như chủ thể, hành động và môi trường xung quanh.
Để vượt qua giới hạn này, nhóm nghiên cứu của nhà khoa học thần kinh Tomoyasu Horikawa tại Phòng thí nghiệm Khoa học truyền thông NTT (Nhật Bản) đã phát triển mô hình AI ngôn ngữ sâu. Trước tiên, họ phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành một “chữ ký ý nghĩa” – biểu đồ số thể hiện nội dung của video.
Sau đó, nhóm tiến hành huấn luyện một hệ thống AI khác để nhận diện mối liên hệ giữa các “chữ ký ý nghĩa” này và hoạt động não bộ của 6 người tham gia khi họ xem video.
Kết quả cho thấy, AI có thể “dịch” chính xác những gì người tham gia đang xem hoặc tưởng tượng thành những câu mô tả hoàn chỉnh, thay vì chỉ liệt kê các từ khóa.
Các chuyên gia nhận định, công nghệ “mind-captioning” không chỉ là một bước đột phá trong nghiên cứu khoa học thần kinh mà còn mở ra nhiều khả năng ứng dụng thực tế. Trong tương lai, kỹ thuật này có thể giúp những người mất khả năng nói giao tiếp thông qua tín hiệu não.
Mặc dù vẫn còn ở giai đoạn thử nghiệm, công nghệ “mind-captioning” đã đánh dấu một bước tiến quan trọng trong việc giải mã ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” – điều trước đây chỉ xuất hiện trong các bộ phim khoa học viễn tưởng – lại gần với thực tế hơn bao giờ hết.
