Các ví dụ cho thấy VideoPoet của Google sẽ trở thành đối thủ mạnh mẽ của Sora được OpenAI phát triển

Buzz

Ngày cập nhật gần nhất: 15/7/2026

Nội dung bài viết

Người dùng sẽ sớm được thấy VideoPoet và các phiên bản kế tiếp của nó tạo ra những video sống động đến ngạc nhiên.

Xem thêm

Đọc tóm tắt

- VideoPoet và các phiên bản kế tiếp tạo ra video sống động từ bức tranh Mona Lisa.
- Trí tuệ nhân tạo đang phát triển mạnh mẽ, mô hình AI sinh video đang nổi lên.
- Khó khăn trong việc tạo ra chuyển động hợp lý, nhưng sẽ được cải thiện theo thời gian.
- Sora của OpenAI và VideoPoet của Google tạo ra video ấn tượng.
- Mô hình AI có khả năng tạo video từ lệnh, ảnh, biến video theo phong cách khác nhau.
- VideoPoet có thể dự đoán nội dung tiếp theo để tạo ra video dài hơn.
- Google minh chứng sức cạnh tranh của mô hình ngôn ngữ lớn trong việc tạo video sống động.

Người dùng sẽ sớm được thấy VideoPoet và các phiên bản kế tiếp của nó tạo ra những video sống động đến ngạc nhiên.

Biến bức tranh Mona Lisa thành 'Một phụ nữ đang nhìn vào ống kính' và 'Một phụ nữ đang ngáp'.

Trong bối cảnh triển vọng của trí tuệ nhân tạo đang ngày càng được khẳng định với các sản phẩm ngày càng hoàn thiện, một làn sóng mới về 'mô hình AI sinh video' đang nổi lên. Tuy nhiên, những mô hình này đang gặp khó khăn lớn trong việc tạo ra những chuyển động hợp lý mà người xem có thể tin tưởng.

Theo thời gian, các mô hình này sẽ học được nhiều hơn, tạo ra các sản phẩm chất lượng và thực tế hơn. Điều tốt là quy trình tạo ra sản phẩm của chúng tương đối đơn giản, chỉ cần một số lệnh thông minh để AI tạo ra video hoặc các sản phẩm tương tự. Ngoài ra, có các mô hình AI đa năng, có thể tạo video từ lệnh, từ ảnh hoặc biến video theo phong cách khác nhau, v.v...

Hiện tại, phần mềm Sora của OpenAI thu hút sự chú ý khi giới thiệu loạt video sinh ra từ AI cực kỳ chân thực và đầy ấn tượng. Tuy nhiên, họ không độc tôn trên con đường của nghiên cứu trí tuệ nhân tạo. Google cũng có dự án tương tự của riêng mình mang tên VideoPoet, đã phát triển được một thời gian và cũng có những sản phẩm rất ấn tượng.

Video về 'Hai con gấu trúc đang chơi bài'.

Video hướng dẫn: 'Ngựa bay trên nền bức tranh Đêm sao của van Gogh'.

Theo những phát hiện của các nhà nghiên cứu tại Google, hình ảnh ban đầu có thể được biến đổi thành video, VideoPoet cũng có thể tự động hoàn thiện nội dung còn thiếu (như phục hồi video gốc) hoặc tạo ra thêm nội dung cho video.

Trong việc tạo ra phong cách mới, mô hình AI sử dụng video để phân tích độ sâu và hiệu ứng ánh sáng, có thể tái tạo chuyển động và thêm nội dung lên để tạo ra phong cách được chỉ đạo bởi người dùng. Dưới đây là kết quả sau khi phong cách hóa một video được tạo ra từ mô hình AI của Google.

Các video hướng dẫn (từ trái sang phải): 'Con wombat đeo kính râm ôm quả bóng chuyền trên bãi biển'; 'Gấu bông trượt băng trên mặt hồ băng giá'; 'Một con sư tử kim loại gầm lên trong ánh sáng của lò rèn'.

Dựa trên khung cuối cùng của video, mô hình AI có thể dự đoán nội dung tiếp theo có thể xảy ra trong giây tiếp theo để tạo ra video dài hơn. Việc lặp lại quá trình này giúp VideoPoet không chỉ mở rộng video một cách dễ dàng mà còn giữ nguyên các đối tượng trong đoạn video ngắn.

Video hướng dẫn: 'Một phi hành gia bắt đầu nhảy trên Sao Hỏa. Rồi bắn pháo hoa rực rỡ từ phía sau'.

VideoPoet cũng có khả năng tạo ra âm thanh. Với các đoạn video dài 2 giây, AI cố gắng dự đoán âm thanh mà không cần hướng dẫn bằng văn bản. Điều này cho phép tạo ra cả video và âm thanh từ một mẫu duy nhất.

Qua VideoPoet, Google đã minh chứng cho sức cạnh tranh vượt trội của các mô hình ngôn ngữ lớn, không chỉ tạo ra nội dung văn bản mà còn sản xuất video sống động, chân thực.

Kết quả cho thấy tiềm năng đáng kể của các mô hình ngôn ngữ lớn trong việc tạo video. Trong tương lai, những mô hình AI như vậy có thể tạo ra nội dung dựa trên nhiều hướng dẫn khác nhau, từ việc sử dụng văn bản để tạo ra âm thanh, tạo video từ câu nói, mô tả video tự động, và nhiều ứng dụng khác.

Các câu hỏi thường gặp

VideoPoet của Google có thể tạo ra loại video nào từ hình ảnh và lệnh không?

Có, VideoPoet có thể biến hình ảnh thành video, tạo ra các video có nội dung mới hoặc phục hồi các đoạn video gốc bị thiếu nội dung, mang lại những sản phẩm sống động và chân thực.

Làm thế nào VideoPoet có thể tạo ra các video dài hơn từ một đoạn ngắn?

VideoPoet sử dụng mô hình AI để dự đoán nội dung tiếp theo dựa trên khung cuối của video, lặp lại quá trình này giúp mở rộng video và giữ nguyên các đối tượng trong video.

AI của VideoPoet có thể tạo âm thanh cho video không?

Có, AI của VideoPoet có khả năng tạo âm thanh cho video. Nó có thể dự đoán âm thanh cho các đoạn video dài 2 giây mà không cần hướng dẫn văn bản.

Sora của OpenAI có phải là đối thủ của VideoPoet trong lĩnh vực AI tạo video không?

Có, Sora của OpenAI là một đối thủ cạnh tranh đáng gờm của VideoPoet, với khả năng tạo ra video sinh ra từ AI cực kỳ chân thực và ấn tượng.

VideoPoet có thể tạo phong cách video mới như thế nào?

VideoPoet sử dụng video để phân tích độ sâu, ánh sáng và các hiệu ứng, từ đó tái tạo chuyển động và thêm nội dung, giúp tạo ra phong cách video mới theo yêu cầu người dùng.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]