Video chỉ ra một điểm yếu chung của các công cụ AI hiện tại: chúng chỉ biết sao chép dữ liệu có sẵn, nhưng không thể hiểu được thực tế hay các quy luật tự nhiên.
Một video được tạo ra bằng công cụ AI Sora của OpenAI đã nhanh chóng gây chú ý trên mạng xã hội, không phải vì tính ấn tượng mà vì những lỗi khủng khiếp trong quá trình xử lý. Video ghi lại cảnh một vận động viên thể dục dụng cụ, nhưng cơ thể cô liên tục bị biến dạng: mọc thêm tay, chân và thậm chí mất đầu trong suốt bài tập.
Đoạn video không chỉ mang lại tiếng cười mà còn phơi bày điểm yếu lớn của Sora và các công cụ tạo video AI khác. Đó là khả năng xử lý chuyển động phức tạp và tuân theo các quy luật vật lý cơ bản.
Video được chia sẻ bởi nhà đầu tư mạo hiểm Deedy Das trên nền tảng X (Twitter cũ). Trong video, vận động viên thực hiện động tác xoay lộn và chạy đà, nhưng AI khiến cô ấy mọc thêm chi thừa, cơ thể biến dạng và thậm chí mất đầu trong vài giây trước khi nó quay lại vị trí cũ.
Deedy Das cho biết anh đã thử nghiệm Sora để kiểm tra khả năng xử lý chuyển động phức tạp trong thể dục dụng cụ, một lĩnh vực mà nhiều công cụ AI trước đây đã thất bại. 'Dù nhân vật trong video nhất quán hơn so với các mô hình cũ, nhưng kết quả cuối cùng vẫn rất đáng sợ. Chúng tôi từng hy vọng AI có thể học được quy luật vật lý, nhưng đến giờ điều đó vẫn chưa xảy ra,' Das chia sẻ.
Tại sao Sora thất bại?
Sora được huấn luyện qua việc phân tích hàng nghìn video kết hợp với các mô tả chi tiết, nhằm 'học' cách tạo video từ các dữ liệu có sẵn. Khi nhận yêu cầu, Sora sẽ dùng các thống kê từ dữ liệu để dự đoán khung hình tiếp theo. Tuy nhiên, với những chuyển động phức tạp như thể dục dụng cụ, AI gặp khó khăn lớn trong việc tái tạo chính xác.
Vấn đề nằm ở chất lượng của dữ liệu huấn luyện. Các video huấn luyện có thể không chính xác hoặc thiếu những chi tiết về chuyển động ở cấp độ từng bộ phận cơ thể. Do đó, Sora không chỉ không hiểu được các quy luật vật lý mà còn xử lý các khung hình một cách lộn xộn, gây ra những lỗi kỳ lạ như trong video.
Những lỗi như của Sora được gọi là hiện tượng 'Jabberwocky', chỉ những kết quả vô nghĩa hoặc kỳ quái mà AI tạo ra. Đây không phải lần đầu AI video gặp phải tình trạng này. Các công cụ khác như Runway Gen-3 hay Hunyuan Video cũng từng tạo ra những kết quả 'kinh dị' khi xử lý yêu cầu vượt quá dữ liệu huấn luyện của chúng.

Hình ảnh tĩnh từ video cho thấy vận động viên thể dục dụng cụ đã bị 'mất đầu'.
Hiện tượng Jabberwocky phản ánh điểm yếu chung của AI video hiện nay: chúng giỏi sao chép dữ liệu có sẵn nhưng không thể hiểu được thực tế hay các quy luật tự nhiên. Khi gặp phải những yêu cầu phức tạp, AI sẽ 'biến tấu' dữ liệu theo cách riêng, dẫn đến kết quả vô nghĩa hoặc kỳ quái.
Để tránh những lỗi tương tự trong tương lai, các nhà phát triển cần cải thiện dữ liệu huấn luyện, bổ sung thêm nhiều video có nhãn chính xác và xây dựng mô hình AI có khả năng hiểu quy luật vật lý tốt hơn. OpenAI cho biết họ đang cải thiện Sora, với mục tiêu đạt được 'ảo giác hiểu biết'—khi AI có thể tạo ra video gần giống thực tế, tương tự như các mô hình ngôn ngữ như GPT trong xử lý văn bản.
Tuy nhiên, AI video cần thêm thời gian để đạt được sự hoàn thiện như kỳ vọng. Hiện tại, Sora và các công cụ tương tự chỉ mới ở giai đoạn đầu phát triển, và những lỗi 'Jabberwocky' như trong video gần đây là điều không thể tránh khỏi.
