Trí Tuệ Nhân Tạo Của Alibaba Có Thể 'Biến' Bức Hoạ Monalisa Biết Nói Và Hát

Buzz

Ngày cập nhật gần nhất: 15/6/2026

Nội dung bài viết

mô hình Emote Portrait Live đại diện cho một bước tiến quan trọng trong việc chuyển đổi hình ảnh tĩnh thành động.

Xem thêm

Đọc tóm tắt

- Emote Portrait Live của Alibaba chuyển đổi ảnh tĩnh thành video nói và hát.
- Công nghệ dựa trên mô hình phân tán tổng hợp video đầu nhân vật từ ảnh và âm thanh, không cần xử lý phức tạp.
- Mô hình nhận diện nhiều biểu cảm và chuyển động tự nhiên, tạo ra nét mặt chân thực.
- Ứng dụng đã biến hóa Mona Lisa hát Shakespeare.

mô hình Emote Portrait Live đại diện cho một bước tiến quan trọng trong việc chuyển đổi hình ảnh tĩnh thành động.

Các kỹ sư Trung Quốc tại Viện Điện toán Thông minh (IIC) của Alibaba vừa phát triển một ứng dụng AI có tên Emote Portrait Live, có khả năng 'biến đổi' một bức ảnh tĩnh thành hình ảnh có thể nói và hát.

Công nghệ đằng sau mô hình Emote Portrait Live dựa trên khả năng tổng hợp của các mô hình phân tán. Mô hình phân tán là một mô hình toán học được sử dụng để mô tả cách mọi thứ lan truyền hoặc phân tán theo thời gian. Trong trường hợp này, mô hình phân tán được sử dụng để mô tả cách các chuyển động trên khuôn mặt lan truyền từ một điểm xuất phát đến các phần khác của khuôn mặt.

Trí Tuệ Nhân Tạo Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát

Mô hình Emote Portrait Live sử dụng mô hình phân tán để tổng hợp trực tiếp video đầu nhân vật từ hình ảnh được cung cấp và bất kỳ clip âm thanh nào. Quá trình này loại bỏ nhu cầu xử lý trước phức tạp hoặc biểu diễn trung gian, từ đó giản đơn hóa việc tạo ra video đầu người biết nói.

Mục tiêu của nhóm nghiên cứu là phát triển một khung đầu biết nói có thể nhận diện được nhiều biểu cảm thực tế trên khuôn mặt, bao gồm cả những biểu cảm tinh tế và cho phép chuyển động đầu tự nhiên. Để đạt được điều đó, các nhà nghiên cứu đã tích hợp các cơ chế điều khiển ổn định vào mô hình của họ, bao gồm cả bộ điều khiển tốc độ và bộ điều khiển vùng mặt, nhằm cải thiện độ ổn định trong quá trình tạo ra.

Trí Tuệ Nhân Tạo Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát 2

So với các Trí Tuệ Nhân Tạo trước đây chỉ có thể biến đổi miệng và một phần của khuôn mặt, Emote có khả năng tạo ra nét mặt, tư thế, nhíu mày hoặc lắc đầu. Đặc biệt, phần miệng được Trí Tuệ Nhân Tạo tạo ra trông rất tự nhiên.

Trong một số video được công bố bởi Alibaba, hình ảnh sẽ được biến đổi thành video và hát các bài được nhập vào nhanh chóng như bức hoạ Mona Lisa kể lại đoạn độc thoại của Rosalind trong As You Like It, Màn 3, Cảnh 2 của Shakespeare.

Các câu hỏi thường gặp

Mô hình Emote Portrait Live là gì và có khả năng gì đặc biệt?

Mô hình Emote Portrait Live là một công nghệ AI phát triển bởi Alibaba, có khả năng biến một bức ảnh tĩnh thành hình ảnh động có thể nói và hát. Công nghệ này sử dụng mô hình phân tán để tạo ra video đầu nhân vật từ hình ảnh và âm thanh, giúp chuyển động đầu và biểu cảm khuôn mặt trở nên tự nhiên.

Công nghệ nào được sử dụng trong mô hình Emote Portrait Live để tạo ra video đầu người?

Mô hình Emote Portrait Live sử dụng mô hình phân tán, một mô hình toán học mô tả cách các chuyển động trên khuôn mặt lan truyền từ một điểm xuất phát đến các phần khác của khuôn mặt, giúp tạo ra các chuyển động tự nhiên và biểu cảm khuôn mặt chi tiết.

Mô hình Emote Portrait Live có thể tạo ra những biểu cảm nào trên khuôn mặt?

Mô hình Emote Portrait Live có thể tạo ra các biểu cảm khuôn mặt tinh tế như nhíu mày, lắc đầu, cười, và thậm chí là chuyển động đầu tự nhiên, điều này giúp hình ảnh trở nên sống động và tự nhiên hơn so với các trí tuệ nhân tạo trước đây.

Mô hình Emote Portrait Live khác gì so với các trí tuệ nhân tạo cũ trong việc tạo ra hình ảnh động?

So với các trí tuệ nhân tạo cũ chỉ có thể biến đổi miệng và một phần khuôn mặt, Emote Portrait Live có khả năng tạo ra các biểu cảm khuôn mặt phức tạp như nhíu mày, lắc đầu, và đặc biệt là phần miệng rất tự nhiên, giúp video trở nên sinh động hơn.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]