Chỉ cần một vài phút video hoặc thậm chí chỉ một đoạn clip âm thanh, mạng nơ-ron nhân tạo đã có thể tạo ra một bản sao 3D gần như hoàn hảo của khuôn mặt diễn viên.
Remedy, nhà sản xuất của các series game nổi tiếng Alan Wake và Quantum Break, đã hợp tác với Nvidia để tái hiện chuyển động khuôn mặt một cách chi tiết nhất. Sử dụng mạng nơ-ron nhân tạo kết hợp với deep learning, tại sự kiện Siggraph 2017, họ đã sử dụng server 8 GPU Nvidia DGX-1 để tạo ra một bản sao 3D cực kì chi tiết và chính xác gần như 100% chỉ từ vài đoạn video.
Theo Remedy và Nvidia, công nghệ này sẽ giúp nhà phát triển game tiết kiệm thời gian lớn. Thay vì phải làm thủ công việc chuyển đổi và chỉnh sửa dữ liệu hình ảnh chuyển động, công việc này giờ đây đã được tự động hóa với mạng nơ-ron nhân tạo.
Việc tái hiện chuyển động khuôn mặt vẫn là thách thức lớn đối với các nhà phát triển game, không chỉ về chi phí mà còn về sự chân thực. Nvidia và Remedy tin rằng mạng nơ-ron nhân tạo có thể tạo ra kết quả đẹp và chân thực hơn nhiều so với các phương pháp truyền thống. Thậm chí, chỉ cần một đoạn clip âm thanh, mạng nơ-ron này cũng có thể phân tích và tạo ra một bản sao 3D khuôn mặt từ các dữ liệu hình ảnh ghi nhận trước đó.
Đầu tiên, mạng nơ-ron cần được cung cấp với các đoạn video chất lượng cao cùng các cử động khuôn mặt được định hình sẵn bởi các họa sĩ 3D. Sau đó, mạng nơ-ron sẽ chỉ cần một đoạn video từ 5 đến 10 phút để tạo ra một bản sao gần như hoàn chỉnh của các cử động mặt của diễn viên. Kết quả (phía phải) gần như tương đương với kĩ thuật ghi lại chuyển động thời gian thực (phía giữa), nhưng yêu cầu ít thông tin đầu vào hơn rất nhiều.
Antti Herva, trưởng bộ phận kỹ thuật nhân vật tại Remedy, nhận xét: “Dựa trên kết quả từ việc tái hiện chuyển động khuôn mặt bằng AI, chúng tôi tin rằng AI sẽ đóng vai trò cách mạng trong quá trình sáng tạo nội dung. Việc tái hiện chuyển động khuôn mặt phức tạp như trong Quantum Break trước đây có thể mất hàng năm để hoàn thành. Sau khi hợp tác với Nvidia để phát triển mạng nơ-ron nhân tạo cho việc tái hiện chuyển động khuôn mặt từ video và âm thanh, chúng tôi đã có thể giảm thời gian này lên tới 80%, đặc biệt là trong các dự án lớn để các họa sĩ có thể tập trung vào các công việc khác.”
Tại Siggraph 2017, Nvidia cũng trình diễn nhiều công nghệ dựa trên trí tuệ nhân tạo để hỗ trợ việc phát triển video game. Ví dụ, họ đã “huấn luyện” một mạng nơ-ron để phát hiện các cạnh gồ ghề của các đối tượng 3D trong game và thay thế chúng bằng các hình ảnh mịn màng hơn, không có hiện tượng răng cưa. Kĩ thuật này sẽ giúp tạo ra các hình ảnh sắc nét hơn so với các phương pháp khử răng cưa hiện tại. Họ cũng sử dụng một mạng nơ-ron khác để tăng tốc quá trình dựng hình các luồng sáng và đổ bóng bằng cách phân biệt luồng sáng hữu ích và không hữu ích đối với hình ảnh cuối cùng.
Mặc dù ấn tượng, những công nghệ này vẫn cần thời gian phát triển và tích hợp vào môi trường làm việc chuyên nghiệp.
Tham khảo từ ArsTechnica