Tại sao The Andy Warhol Diaries Tái tạo Giọng nghệ sĩ Bằng Trí tuệ Nhân tạo

Trong những năm 1982, Andy Warhol đã, hơi tristemente, biến thành một robot. Chiếc máy được tạo ra bởi một cựu nhân viên Disney Imagineering cho một dự án chưa bao giờ thực sự phát triển, nhưng Warhol thích bản sao animatronic của mình. “Máy móc ít vấn đề hơn,” ông một lần nói. “Tôi muốn trở thành một máy móc, còn bạn thì sao?” Nghệ sĩ, người qua đời vào năm 1987, là một bậc thầy của đám đông theo đuổi văn hóa cá nhân của mình, và robot này thực sự là một biểu hiện của cách thế giới nhìn nhận ông: được chế tạo tỉ mỉ, nếu có chút cứng nhắc và đơn điệu trong phong cách trò chuyện của ông.

Andrew Rossi knows this. It’s part of the reason the filmmaker felt OK letting an artificially intelligent machine speak for Warhol in his new documentary series for Netflix. Based on a book of the same name, the six-part documentary The Andy Warhol Diaries is partially narrated by an AI reading the stories that the artist told diarist Pat Hackett. The voice sounds just like Warhol—and then you remember the voice the world knew was always a flat and robotic one. Warhol’s work is about questioning iconography and surface-level appeal. He kept his voice flat to maintain that image, to belie how much heart he actually put into it, Rossi says, adding “when he spoke, he continued this superficial performance that was also part of the way he dressed and the way he made art.”
Ngay cả khi đó, việc sử dụng giọng nói AI để nói thay cho một nhân vật văn hóa được yêu thích—hoặc bất cứ ai, thực sự—đều không thiếu những thách thức về đạo đức. Rossi đã bắt đầu chỉnh sửa The Andy Warhol Diaries mùa hè năm ngoái khi nổi lên một cuộc tranh cãi xung quanh việc đạo diễn Morgan Neville sử dụng trí tuệ nhân tạo để tái tạo giọng nói của Anthony Bourdain cho bộ phim tài liệu Roadrunner. Rossi đã thảo luận với Quỹ Andy Warhol về sự tái tạo bằng trí tuệ nhân tạo, và bộ phim về Bourdain đã truyền cảm hứng cho một câu tuyên bố xuất hiện vài phút vào Diaries tuyên bố rằng giọng nói đã được tạo ra với sự cho phép của Quỹ. “Khi Andrew chia sẻ ý tưởng sử dụng giọng nói AI, tôi nghĩ, ‘Wow, điều này thật táo bạo cũng như là thông minh,’” nói Michael Dayton Hermann, giám đốc cấp phép của Quỹ.
Bằng cách trung thực, bộ phim tài liệu của Rossi tránh được một trong những vấn đề lớn mà Roadrunner đối mặt. Người xem biết ngay từ đầu rằng những gì họ nghe là tạo ra bởi máy tính; trong khi một phần lớn sự phản đối mà Neville phải đối mặt đến từ việc deepfake của ông không được tiết lộ ban đầu. Nhưng điều đó không có nghĩa là vẫn không có nhiều câu hỏi chưa có câu trả lời về việc nào là chấp nhận được và nào không khi tái tạo giọng nói của ai đó bằng máy. Trong bộ phim về Bourdain, những từ mà trí tuệ nhân tạo nói thực sự được viết bởi đầu bếp đã mất, nhưng không có bản ghi âm thực sự của ông nói chúng. Đối với Diaries, Warhol đã một lần nói tất cả những điều mà trí tuệ nhân tạo Andy nói—ông đã nói chúng với Hackett—nhưng chúng không được ghi âm vào thời điểm đó. Những quy định này có tạo ra sự khác biệt không? Cả hai bộ phim tài liệu đều sử dụng trí tuệ nhân tạo vì các chủ thể của họ đã qua đời. Có lẽ, sẽ có một loạt các vấn đề đạo đức khác nếu họ còn sống. Ngay cả khi giọng nói không được tái tạo? Ngay cả khi hình dạng của họ cũng được tái tạo? Trí tuệ nhân tạo và các công nghệ khác đang phát triển đến một điểm mà hiệu ứng kỹ thuật số có thể tạo ra toàn bộ các buổi biểu diễn. Câu hỏi sẽ sớm là liệu họ nên hay không nên.
Zohaib Ahmed nghĩ nhiều về những vấn đề này. Giám đốc điều hành của Resemble AI, ông là người mà Rossi đã hợp tác để tạo ra giọng của Warhol. Nhưng trước khi Ahmed thậm chí ký vào dự án, ông đã đảm bảo rằng Quỹ Andy Warhol đã đồng ý. Nói chung, Resemble AI làm việc với giọng nói của những người vẫn còn sống—chủ yếu là tạo ra các câu trả lời giọng tự động cho các trung tâm cuộc gọi và tương tự—nhưng công ty cho biết họ vẫn chặt chẽ với các nguyên tắc. “[Nhật ký của Warhol] được viết một cách rất thú vị, gần như như là để đọc lên. Chúng ở trong giọng của ông,” Ahmed nói. “Gần như như là điều này là một phần mở rộng của công việc của Andy, nên chúng tôi không tạo ra điều gì đó là một tình huống đạo đức đối với chúng tôi.”
Vì vậy, đối với cả hai, dự án này cảm thấy có đạo đức, nhưng không dễ dàng. Đầu tiên, có giọng của Warhol ông chế tạo cho chính mình—một giọng đơn điệu được xây dựng từ việc lớn lên ở Pittsburgh và những năm trong đồng cảnh nghệ thuật thành phố New York. Ngoài ra, Ahmed và đội ngũ của ông không có nhiều giọng đó để làm việc. Khi công ty bắt đầu, họ chỉ có khoảng 3 phút và 12 giây dữ liệu âm thanh—và cần tạo ra một giọng có thể đọc khoảng 30 trang văn bản. Để làm được điều đó, trí tuệ nhân tạo của Resemble sử dụng các đặc điểm—hoặc âm vị—của giọng của Warhol có trong bộ dữ liệu đó để dự đoán các âm vị không có để tạo ra một giọng khá đầy đủ. Giọng đó sau đó được tải lên nền tảng web của công ty, nơi người dùng—trong trường hợp này, Rossi—có thể gõ vào những gì họ muốn giọng nói và sau đó yêu cầu trí tuệ nhân tạo điều chỉnh cho đến khi nó nghe như họ muốn. Khả năng có sự tham gia của con người đó, Ahmed nói, là “rất mạnh mẽ.” Điều này thậm chí cho phép Rossi thay đổi cảm xúc hoặc khiến Warhol nói những từ cần có phong cách đặc trưng—như, ví dụ, tên của người bạn và cộng sự Jean-Michel Basquiat.
Cuối cùng, trí tuệ nhân tạo không thực sự làm mọi thứ chỉ dựa vào vài phút đó. Trong quá trình, Rossi đã mời diễn viên Bill Irwin ghi âm một số dòng bằng giọng Warhol để giúp máy học cách phát âm đúng. “Chúng tôi đã thử nghiệm các mô hình kết hợp 80 đến 75 phần trăm giọng của trí tuệ nhân tạo và 20 đến 15 phần trăm của diễn xuất của Bill,” Rossi nói. “Cuối cùng, giọng của Andy trong suốt loạt phim mang đến một biến thể của phạm vi trên mô hình nội suy này.” Một số từ—như “quaalude,” ví dụ, hoặc “Rorschach test”—cần thêm hiệu ứng tần số âm thanh, và đôi khi Rossi chèn âm thanh vào thuật toán ngôn ngữ học, buộc trí tuệ nhân tạo nói những điều theo cách nhất định thông qua chính việc đánh vần sáng tạo. “Hãy nhớ,” đạo diễn nói, “điều này dành cho Andy, người có giọng Pittsburgh nhưng đang phát biểu tên và địa điểm qua điện thoại như một New Yorker kỳ cựu.”
The Andy Warhol Diaries, lúc đó, là một lời nhắc về điều gì có thể là khả thi. Nó không trả lời đầy đủ tất cả các câu hỏi hiện đang xoay quanh đạo đức của việc sử dụng trí tuệ nhân tạo để đưa lại những nhân vật nổi tiếng lâu đời—nhưng nó thể hiện cách công nghệ có thể gần đến việc tái tạo quá khứ trong khi cũng minh bạch về điều đó là gì. “Khi tôi lần đầu nghe giọng được tạo ra bởi trí tuệ nhân tạo,” Hermann nói, “tôi cảm thấy tự tin rằng đó sẽ là một cách cực kỳ hiệu quả để đưa nhật ký của Warhol trở nên sống động và nhân cách hóa người nghệ sĩ bí ẩn.” Có lẽ, nói cách khác, một robot có thể giúp chúng ta hiểu ông tốt hơn bất cứ điều gì.
- 📩 Cập nhật về công nghệ, khoa học và nhiều hơn nữa: Nhận bản tin của chúng tôi!
- Họ “gọi để giúp đỡ.” Sau đó, họ đánh cắp hàng nghìn
- Đại dịch làm sụt giảm tỷ lệ tiêm chủng ở trẻ em
- Những sản phẩm mới thú vị nhất tại MWC 2022
- Elden Ring là trò chơi của năm
- Startups ngày nay có nhiều tiền—và tiết kiệm
- 👁️ Khám phá trí tuệ nhân tạo như chưa bao giờ có với cơ sở dữ liệu mới của chúng tôi
- 🎧 Âm thanh không nghe đúng? Kiểm tra tai nghe không dây, thanh âm thanh và loa Bluetooth yêu thích của chúng tôi
