Microsoft Giới Thiệu VASA, Công Nghệ AI Mới Hỗ Trợ Tạo Video Từ Ảnh Và Tương Tác Giọng Nói

Buzz

Ngày cập nhật gần nhất: 15/6/2026

Nội dung bài viết

VASA-1 có khả năng tạo ra những video thực tế chỉ từ một hình ảnh duy nhất.

Xem thêm

Đọc tóm tắt

- VASA-1 là ứng dụng AI mới của Microsoft Research Asia, có khả năng tạo video từ một hình ảnh và âm nhạc, đồng bộ hóa chuyển động miệng và môi.
- Công nghệ này tiên tiến nhưng vẫn còn hạn chế như không chính xác với chi tiết nhỏ như răng, và có nguy cơ lạm dụng để tạo video giả mạo.

VASA-1 có khả năng tạo ra những video thực tế chỉ từ một hình ảnh duy nhất.

Microsoft Research Asia vừa công bố một báo cáo mới về ứng dụng AI sáng tạo đang phát triển có tên là VASA-1. Được thiết kế để tạo ra video thực tế chỉ từ một hình ảnh khuôn mặt và âm nhạc, VASA-1 cũng có khả năng thay đổi khuôn mặt theo thời gian thực.

Microsoft Giới Thiệu VASA, Công Nghệ AI Mới Hỗ Trợ Tạo Video Từ Ảnh Và Tương Tác Giọng Nói

Ứng dụng này sử dụng một khung học máy để phân tích hình ảnh khuôn mặt, sau đó đồng bộ hóa chuyển động của miệng và môi với âm thanh, mô phỏng các biểu cảm và chuyển động cơ thể.

Mặc dù ứng dụng này rất tiên tiến, nhưng vẫn còn một số hạn chế, ví dụ như chi tiết nhỏ như răng có thể không chính xác, thay đổi kích thước và hình dạng miệng khi nói.

Ngoài ra, các nhà nghiên cứu cũng đã sử dụng AI để tạo ra các khuôn mặt trong các bản demo của họ, thử nghiệm trên các hình ảnh từ thực tế đến nghệ thuật, chẳng hạn như bức tranh Mona Lisa. Tuy nhiên, có những lo ngại rằng công nghệ này có thể bị lạm dụng để tạo ra các video giả mạo, lừa đảo, hoặc tuyên truyền thông tin sai lệch.

Microsoft Giới Thiệu VASA, Công Nghệ AI Mới Hỗ Trợ Ảnh Chuyển Động Và Tương Tác Giọng Nói 2

Do đó, nhóm nghiên cứu quyết định không công bố công khai ứng dụng cho đến khi đảm bảo rằng nó sẽ được sử dụng một cách có trách nhiệm và tuân thủ các quy định phù hợp. Công nghệ này cũng có tiềm năng để sử dụng trong các ứng dụng thực tế, như tạo hình đại diện video thực tế trong thời gian thực mà không cần dùng đến nguồn video tiêu tốn băng thông, tương tự như công nghệ Spatial Personas của Apple.

Các câu hỏi thường gặp

VASA-1 có khả năng tạo video từ bao nhiêu hình ảnh?

VASA-1 có khả năng tạo ra video thực tế chỉ từ một hình ảnh duy nhất của khuôn mặt. Công nghệ này sử dụng AI để phân tích và mô phỏng chuyển động, mang đến những video ấn tượng.

Microsoft Research Asia đã công bố điều gì về VASA-1 gần đây?

Microsoft Research Asia vừa công bố một báo cáo về ứng dụng AI VASA-1, cho phép tạo video thực tế từ hình ảnh và âm nhạc, đồng thời thay đổi khuôn mặt trong thời gian thực.

Có những hạn chế nào khi sử dụng VASA-1 trong tạo video không?

Có, VASA-1 vẫn gặp phải một số hạn chế, chẳng hạn như việc mô phỏng chi tiết nhỏ như răng có thể không chính xác, cũng như việc thay đổi kích thước và hình dạng miệng không hoàn hảo khi nói.

VASA-1 có thể bị lạm dụng trong việc tạo video giả mạo không?

Có, có lo ngại rằng công nghệ VASA-1 có thể bị lạm dụng để tạo video giả mạo hoặc tuyên truyền thông tin sai lệch, do đó nhóm nghiên cứu quyết định chưa công bố công khai ứng dụng này.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]