TPO - Các nhà nghiên cứu tại Meta đã ứng dụng trí tuệ nhân tạo (AI) kết hợp với kỹ thuật quét não không xâm lấn để giải mã quá trình chuyển đổi suy nghĩ thành văn bản, theo hai nghiên cứu mới được công bố.

Hai nghiên cứu mới làm sáng tỏ cách chúng ta có thể chuyển đổi suy nghĩ thành câu viết trên giao diện kỹ thuật số. (Ảnh: Meta)
Trong một nghiên cứu, các nhà khoa học đã phát triển một mô hình AI có khả năng giải mã tín hiệu não và chuyển đổi chúng thành văn bản. Trong nghiên cứu thứ hai, nhóm nghiên cứu tương tự đã sử dụng AI để lập bản đồ não, biến suy nghĩ thành văn bản đánh máy.
Các nhà khoa học cho rằng những phát hiện này có thể mở đường cho các giao diện não-máy tính không xâm lấn, hỗ trợ những người bị tổn thương não hoặc chấn thương trong việc giao tiếp.
"Đây là một bước tiến quan trọng trong lĩnh vực giải mã, đặc biệt là với phương pháp không xâm lấn", Alexander Huth, nhà khoa học thần kinh tính toán tại Đại học Texas ở Austin, Mỹ, nhận định.
Giao diện não-máy tính sử dụng các kỹ thuật giải mã tương tự đã được cấy ghép vào não của những người mất khả năng giao tiếp, nhưng các nghiên cứu mới có thể mở ra hướng đi tiềm năng hướng tới các thiết bị đeo được.
Trong nghiên cứu đầu tiên, nhóm nghiên cứu đã áp dụng kỹ thuật từ não đồ (MEG), đo lường từ trường được tạo ra bởi các xung điện trong não, để theo dõi hoạt động thần kinh khi người tham gia gõ câu. Sau đó, họ huấn luyện một mô hình ngôn ngữ AI để giải mã tín hiệu não và tái tạo các câu từ dữ liệu MEG.
Mô hình giải mã các chữ cái mà người tham gia gõ với độ chính xác 68%. Các chữ cái phổ biến được giải mã chính xác hơn, trong khi những chữ cái ít xuất hiện như Z và K có tỷ lệ lỗi cao hơn. Khi mô hình mắc lỗi, nó thường thay thế bằng các ký tự gần với chữ cái mục tiêu trên bàn phím QWERTY, cho thấy mô hình sử dụng tín hiệu vận động từ não để dự đoán chữ cái được gõ.
Nghiên cứu thứ hai của nhóm dựa trên những phát hiện này để chỉ ra cách ngôn ngữ được hình thành trong não khi một người gõ. Các nhà khoa học đã thu thập 1.000 ảnh chụp nhanh MEG mỗi giây khi người tham gia gõ một số câu. Từ những ảnh chụp này, họ giải mã các giai đoạn khác nhau của quá trình tạo câu.
Để tránh việc biểu diễn một từ hoặc chữ cái gây ảnh hưởng đến từ hoặc chữ cái tiếp theo, nhóm nghiên cứu phát hiện rằng não sử dụng "mã thần kinh động" để giữ chúng tách biệt. Mã này liên tục thay đổi vị trí biểu diễn thông tin trong các vùng não liên quan đến sản xuất ngôn ngữ.
Điều này cho phép não liên kết các chữ cái, âm tiết và từ liên tiếp trong khi vẫn duy trì thông tin về từng yếu tố trong thời gian dài hơn. Tuy nhiên, các thí nghiệm MEG không thể xác định chính xác vị trí trong các vùng não mà mỗi biểu diễn ngôn ngữ này xuất hiện.
