Đến nay, OpenAI vẫn chưa cung cấp bất kỳ thông báo chính thức nào giải thích nguyên nhân của sự cố này.
OpenAI, công ty tiên phong trong nghiên cứu và phát triển trí tuệ nhân tạo (AI), mới đây đã cho ra mắt mô hình AI mang tên o1, có khả năng "lý luận". Tuy nhiên, chỉ sau một thời gian ngắn, o1 đã khiến nhiều người bất ngờ với hiện tượng kỳ lạ: mô hình này đôi khi tự 'suy nghĩ' bằng tiếng Trung, tiếng Ba Tư hay các ngôn ngữ khác, dù câu hỏi ban đầu được đặt bằng tiếng Anh.
Khi được giao một bài toán, ví dụ như "Có bao nhiêu chữ 'R' trong từ 'strawberry'?", o1 sẽ bắt đầu 'suy nghĩ', thực hiện một chuỗi các bước lý luận để đi đến câu trả lời. Nếu câu hỏi được viết bằng tiếng Anh, câu trả lời của o1 cũng sẽ bằng tiếng Anh. Tuy nhiên, mô hình này lại sử dụng ngôn ngữ khác trong một số bước lý luận trước khi đưa ra kết luận.

Ảnh chụp màn hình cho thấy mô hình o1 của OpenAI sử dụng tiếng Trung Quốc trong quá trình lý luận.
Một người dùng trên Reddit đã bình luận: "[o1] đột nhiên bắt đầu suy nghĩ bằng tiếng Trung khi đang giải bài toán." Trong khi đó, một người dùng khác trên nền tảng X đặt câu hỏi: "Tại sao [o1] lại chuyển sang suy nghĩ bằng tiếng Trung mà không có lý do rõ ràng? Không có phần nào trong cuộc trò chuyện (hơn 5 tin nhắn) là bằng tiếng Trung cả."
Cho đến nay, OpenAI vẫn chưa giải thích về hiện tượng kỳ lạ của o1, thậm chí họ còn không thừa nhận sự việc này. Vậy điều gì đang thực sự xảy ra?
Các chuyên gia AI hiện tại vẫn chưa đưa ra kết luận rõ ràng, nhưng họ đã đưa ra một số lý thuyết. Trên nền tảng X, nhiều người, bao gồm cả CEO của Hugging Face - Clément Delangue, suy đoán rằng các mô hình lý luận như o1 có thể đã được huấn luyện trên các bộ dữ liệu chứa nhiều ký tự tiếng Trung Quốc. Ted Xiao, nhà nghiên cứu tại Google DeepMind, cho rằng OpenAI có thể đã sử dụng dịch vụ gán nhãn dữ liệu từ các công ty bên thứ ba ở Trung Quốc, và sự chuyển đổi ngôn ngữ của o1 là một ví dụ về "ảnh hưởng ngôn ngữ Trung Quốc trong quá trình lý luận".

Mặc dù vậy, một số chuyên gia không đồng tình với giả thuyết cho rằng việc gán nhãn dữ liệu tiếng Trung là nguyên nhân khiến o1 chuyển sang tiếng Trung Quốc. Họ cho rằng o1 cũng có thể sử dụng các ngôn ngữ khác như tiếng Hindi, tiếng Thái, nhưng mô hình này lại không làm vậy.
Thay vì vậy, các chuyên gia này cho rằng o1 và các mô hình lý luận tương tự có thể chỉ đơn giản chọn sử dụng ngôn ngữ mà chúng thấy phù hợp nhất để giải quyết vấn đề. Matthew Guzdial, nhà nghiên cứu AI và giáo sư tại Đại học Alberta, giải thích: "Mô hình không nhận thức được ngôn ngữ là gì hay sự khác biệt giữa các ngôn ngữ. Đối với nó, tất cả chỉ là văn bản."
Luca Soldaini, nhà nghiên cứu tại Viện AI phi lợi nhuận Allen, cũng nhấn mạnh rằng chúng ta không thể chắc chắn lý do tại sao o1 lại hoạt động như vậy do tính chất "đen hộp" của các mô hình này. "Đây là một trong những lý do quan trọng để tính minh bạch trong thiết kế hệ thống AI được đặt lên hàng đầu", ông cảnh báo.
Vì chưa có câu trả lời chính thức từ OpenAI, chúng ta chỉ còn cách tự suy đoán tại sao o1 lại chọn suy nghĩ về một bài hát bằng tiếng Pháp, nhưng lại chọn tiếng Quan Thoại để nghĩ về sinh học tổng hợp.
