AI đã dựng lên một "thực tại song song", nơi Studio Ghibli tạo ra kiệt tác Chúa Nhẫn.

Gần đây, người dùng chatbot AI đã rất phấn khích với bản cập nhật mới của , mang đến tính năng tạo ảnh tiên tiến. Khi bạn thấy một bức tranh mang đậm phong cách Ghibli trên mạng xã hội, khả năng cao đó là tác phẩm do tạo ra. Trào lưu này đã trở nên cực kỳ phổ biến đến mức CEO của OpenAI, Sam Altman, cũng thay đổi hình đại diện trên X của mình.

Tuy nhiên, nếu bạn nhìn thấy phiên bản Chúa Nhẫn (LotR) theo phong cách Ghibli, thì đây không phải là sản phẩm của Sora (hệ thống AI của OpenAI có thể sinh video từ văn bản) đâu! Để tạo ra tác phẩm này, người sáng tạo đã sử dụng rất nhiều công cụ khác nhau.
Đây là sản phẩm của PJ Accetturo, một cá nhân tự xưng là “Nhà làm phim AI”; anh đã từng xuất hiện trên các tờ báo lớn như Variety, Hollywood Reporter, BBC và Animation Magazine.
PJ Accetturo đã tạo ra tác phẩm này bằng sự kết hợp giữa Sora của OpenAI và các công cụ trí tuệ nhân tạo khác như Kling và Luma.
Theo lời PJ Accetturo, quá trình “làm phim” này bao gồm nhiều công đoạn. Đầu tiên, anh chụp lại toàn bộ 102 cảnh trong trailer của phần đầu tiên của Chúa Nhẫn; sau đó, anh sử dụng Sora của OpenAI để tái tạo lại 102 cảnh này theo phong cách hoạt hình của Studio Ghibli.


Với Sora, anh sử dụng các prompt như thế này để tái tạo lại những bức ảnh:
Hãy tái tạo cảnh này theo phong cách Studio Ghibli, với mức độ chi tiết sắc sảo. Đảm bảo bố cục, màu sắc và bầu không khí phải tương đồng. Cảnh trong bức ảnh mô tả những nhân vật khoác áo choàng đen, cưỡi trên những con ngựa đen, phi nước đại để chạy trốn khỏi một con sóng khổng lồ trên lòng sông đang đuổi theo họ.

Anh cũng dùng Kling và Luma AI để chuyển động hóa một số bức ảnh đã có. Do không có đủ thời gian để làm cho môi của nhân vật đồng bộ với lời thoại, PJ Accetturo chỉ cần dùng các prompt đơn giản như "một người đàn ông đang hét lớn, trong sợ hãi" hay "một người phụ nữ đang nói, biểu cảm lo âu, cau mày".
Anh kết hợp cả Kling và Luma. Khi một công cụ không cho ra kết quả như mong muốn, anh sẽ chuyển sang công cụ còn lại.

Theo chia sẻ, PJ Accetturo đã chi 250 USD để đổi ra đơn vị tiền tệ của Kling, nhằm yêu cầu mô hình AI ghép những bức ảnh lại thành video.
Từ các công đoạn sản xuất trên, hầu hết những người đã quen với chatbot AI đều có thể thực hiện theo. Qua câu chuyện này, chúng ta cũng học được một số bài học quan trọng trong việc sản xuất nội dung bằng trí tuệ nhân tạo.
Đầu tiên, cần hiểu rõ các công cụ AI có thể làm gì để tận dụng tối đa khả năng của chúng. PJ Accetturo biết rằng Sora mạnh mẽ trong việc tái tạo tranh ảnh theo phong cách cụ thể, và hiểu rõ Kling và Luma có khả năng biến ảnh tĩnh thành hoạt hình, nên đã tạo ra một thước phim ấn tượng.
Bên cạnh đó, người dùng phải đặt prompt một cách chính xác, ít nhất là phải đúng chính tả, còn nếu muốn chi tiết hơn thì cần phải mô tả rõ ràng ý tưởng mình muốn biến thành hiện thực.
Có những thứ có thể xử lý đơn giản bằng prompt – như việc làm cho môi của nhân vật chuyển động, nhưng cũng có những thứ đòi hỏi người dùng phải có vốn từ vựng và trí tưởng tượng phong phú – ví dụ như miêu tả cảnh con sóng khổng lồ đuổi theo đàn Nazgul.
Cuối cùng, người dùng các công cụ AI cần phải rèn luyện thêm sự kiên nhẫn. Như PJ Accetturo đã chia sẻ, anh đã mất 9 giờ chỉ để chỉnh sửa lại các bức ảnh động đã tạo ra để ghép thành một video hoàn chỉnh.
Quá trình tạo ảnh không thể hoàn tất chỉ với vài prompt đơn giản, bạn cần phải thử đi thử lại nhiều lần để tìm ra một prompt hoàn hảo, có thể thể hiện đầy đủ ý tưởng của mình. Việc “nói mãi mà AI không hiểu” có thể khiến nhiều người cảm thấy nản lòng, khi vừa mất tiền vừa mất thời gian.
Hiện nay, quá trình “làm phim” kể trên cần có 4 yếu tố chính: khái niệm về “phim hoạt hình Ghibli”, một sản phẩm mẫu để AI học hỏi – chính là trailer của phần đầu tiên Chúa Nhẫn, một bộ công cụ AI đa năng có thể thực hiện nhiều công đoạn, và một cá nhân kiên trì, biết cách tận dụng thế mạnh của cả mình và của AI.
Có lẽ bất cứ ai cũng có thể sở hữu từ 3 đến 4 yếu tố trên. Điều này có thể chính là tương lai của ngành sáng tạo: ai cũng có thể tạo ra những sản phẩm hấp dẫn. Câu hỏi đặt ra là, sản phẩm của ai đủ thú vị để vượt lên và nổi bật giữa đám đông?
