
Ban nhạc dance punk YACHT luôn có vẻ như một hành động có phần công nghệ kể từ khi ra mắt vào đầu những năm 2000. Họ nổi tiếng khi ghi âm các phiên bản nhạc cụ của hai album trước đó và đưa chúng sẵn có cho các nghệ sĩ theo giấy phép Creative Commons tại Free Music Archive. Sau sự kiện Snowden, họ viết một bài hát mang tên “Party at the NSA” và quyên góp thu nhập cho EFF. Một bìa album của họ chỉ có thể được truy cập thông qua fax ban đầu (được gửi qua một ứng dụng web mà YACHT phát triển để xác định máy fax gần nhất với các nhóm người hâm mộ; OfficeMax chắc chắn rất thích nó). Ca sĩ Claire L. Evans thậm chí còn viết cuốn sách (Broad Band) về các nữ pionner của internet.
Vì vậy, khi Evans xuất hiện tại sự kiện Google I/O mùa hè này, chúng tôi biết cô không chỉ xuất hiện để quảng cáo như Drake hoặc The Foo Fighters. Trong một buổi nói có tiêu đề “Âm nhạc và Học Máy”, Evans thay vào đó dẫn dắt một phòng đầy nhà phát triển qua một bí mật mở khá thú vị đang chờ đợi người hâm mộ âm nhạc đến cuối tuần này: YACHT đã dành ba năm qua để viết một album mới mang tên Chain Tripping (phát hành vào ngày 30 tháng 8). Và quá trình này mất một khoảng thời gian vì ban nhạc muốn thực hiện nó với những gì Evans gọi là “quá trình sáng tác được tạo ra bằng học máy”.
“Tôi biết đây không phải là cách kỹ thuật để giải thích, nhưng điều này cho phép chúng tôi tìm thấy những giai điệu ẩn giữa các bài hát trong bộ sưu tập âm nhạc cũ của chúng tôi,” cô nói trong bài nói của mình tại sự kiện Google I/O. “Dưới đây là giao diện mà người dùng nhìn thấy khi chúng tôi ghi âm album vào tháng 5 năm ngoái - đó là một Colab Notebook, không phải là thứ mà những người nghệ sĩ thường mang vào phòng thu.”
YACHT đã lâu đã có sở thích về Trí tuệ nhân tạo và ứng dụng tiềm năng của nó trong âm nhạc. Nhưng nhóm nhạc cho biết đến Ars rằng cho đến gần đây, khoảng năm 2016, khái niệm về việc làm một album đầy đủ bằng cách tiếp cận này mới trở nên khả thi. Trong khi các tổ chức nghiên cứu đã lâu đã thử nghiệm với Trí tuệ nhân tạo hoặc học máy và để máy tính tự động tạo ra âm nhạc, kết quả cảm giác như một dự án nghiên cứu hơn là các album phù hợp với DFA Records (nơi có những đồng nghiệp như Hot Chip hoặc LCD Soundsystem). Cuối cùng, một dòng chảy chậm chạp của các ứng dụng đơn giản hóa tận dụng Trí tuệ nhân tạo - các ứng dụng đổi khuôn mặt cảm giác rất lớn vào thời điểm đó; Snapchat và bộ lọc động của nó trỗi lên - cuối cùng đã mang lại cho ban nhạc ý tưởng rằng bây giờ có thể là thời điểm.
“Chúng tôi có thể là một ban nhạc rất công nghệ, nhưng không ai trong chúng tôi là lập trình viên,” Evans nói với Ars. “Chúng tôi thường tiếp cận vấn đề từ bên ngoài và cố gắng tìm hiểu cách thức để thao tác và uốn cong công cụ cho mục đích cụ thể kỳ lạ của chúng tôi. Trí tuệ nhân tạo dường như là một điều gần như không thể, nó đã phát triển nhanh chóng hơn bất kỳ thứ gì chúng tôi từng đối mặt... Và chúng tôi muốn sử dụng điều này không chỉ để đạt được mục tiêu kỹ thuật của việc tạo ra âm nhạc - để chúng tôi có thể nói, ‘Ối, một trí tuệ nhân tạo đã viết bài hát pop này’ - mà chúng tôi muốn sử dụng công nghệ này để tạo âm nhạc YACHT, để tạo ra âm nhạc mà chúng tôi đồng nhất và cảm thấy nó đến từ chúng tôi.”
Mang theo một Sổ tay Colab vào phòng thu rock
Việc nảy ra ý tưởng sử dụng trí tuệ nhân tạo để một cách nào đó tạo ra âm nhạc là một điều; thực hiện nó lại chứng minh là một điều hoàn toàn khác. Ban nhạc bắt đầu bằng cách nhìn vào mọi thứ có sẵn: “Chúng tôi thử nghiệm mọi thứ mà công khai, một số công cụ chỉ có sẵn riêng tư - chúng tôi đã gửi email lạnh đến mọi người hoặc thực thể hoặc công ty nào đang làm việc với Trí tuệ nhân tạo và sáng tạo,” như Jona Bechtolt, người sáng lập YACHT, mô tả. Nhưng không có một giải pháp hiện tại nào cung cấp đủ sự kết hợp giữa chất lượng và dễ sử dụng mà ban nhạc hy vọng. Vì vậy, họ quyết định xây dựng hệ thống của riêng mình bằng cách mượn những phần nhỏ từ khắp nơi, tận dụng toàn bộ bộ sưu tập âm nhạc cũ trong quá trình đó.
“Chúng tôi biết rằng chúng tôi sẽ phải dựa trên một loại dữ liệu nào đó, vì vậy từ rất sớm, chúng tôi nghĩ, ‘Làm thế nào nếu chúng tôi sử dụng bộ sưu tập âm nhạc cũ của chúng tôi?” Bechtolt nói. “Chúng tôi ngây thơ nghĩ rằng nó sẽ giống như Shazam, nơi chúng tôi có thể đưa âm thanh thô vào một thuật toán. Điều đó thực sự không khả thi...”
“Hoặc, ít nhất là, không trong phạm vi của khả năng tính toán của chúng tôi,” Evans chen ngang.
“Vì vậy, chúng tôi phải ghi chú tất cả các bài hát của chúng tôi bằng MIDI, một quy trình đầy công sức,” Bechtolt tiếp tục. “Chúng tôi có 82 bài hát trong bộ sưu tập âm nhạc cũ của mình, điều này vẫn chưa đủ để đào tạo một mô hình đầy đủ, nhưng đã đủ để làm việc với các công cụ chúng tôi có.”

Với dữ liệu MIDI đó, Bechtolt và đồng sáng tác lâu năm (bass và người chơi đàn keyboard) Rob Kieswetter bắt đầu bằng cách xác định các đoạn nhỏ - một đoạn riff guitar cụ thể, một giai điệu vocal, một khuôn nhịp trống, từ hai thanh đến 16 thanh - có thể được lặp lại, kết hợp và cuối cùng chạy qua mô hình AI và ML đơn giản của ban nhạc. Ban nhạc phụ thuộc nặng vào Sổ tay Colab trong trình duyệt web - cụ thể là mô hình MusicVAE từ đội Magenta của Google - nhập dữ liệu bằng tay và sau đó đợi (và đợi) để có một đoạn nhỏ đầu ra từ quy trình làm việc này. Và đoạn nhỏ được tạo ra bằng AI/ML, tất nhiên, chỉ là dữ liệu, thông tin MIDI thêm. Evans cho biết ban nhạc chạy các cặp vòng lặp này qua Sổ tay Colab ở nhiệt độ khác nhau “đôi khi hàng chục, nếu không phải hàng trăm lần để tạo ra một lượng thông tin giai điệu lớn” như nguồn tư liệu cho các bài hát mới. Từ đó, đến lượt con người thực hiện.
“Nó vẫn không thể tạo ra một bài hát chỉ bằng cách nhấn một nút; đó hoàn toàn không phải là một quy trình dễ dàng hoặc vui vẻ để làm việc qua,” Bechtolt nói. “Vì vậy sau ba ngày, chúng tôi nghĩ, ‘OK, tôi nghĩ chúng ta đã có đủ đồ.’ Tính đến thời điểm đó, chúng tôi có một vài nghìn đoạn video giữa hai và 16 thanh, và chúng tôi chỉ cần dừng lại tại một số điểm nào đó.”
“Đó không phải là một cái gì đó chúng tôi đưa vào mô hình, nhấn in và có những bài hát,” Evans thêm vào. “Chúng tôi phải tham gia. Phải có một con người tham gia ở mọi bước của quá trình để cuối cùng tạo ra âm nhạc... Cấu trúc lớn hơn, lời bài hát, mối quan hệ giữa lời bài hát và cấu trúc - tất cả những điều này vượt quá khả năng của công nghệ, và đó là điều tốt.”
Câu chuyện này ban đầu xuất hiện trên Ars Technica.
Những điều tuyệt vời khác trên Mytour
- Không ai đang xem những bộ phim quái vật khổng lồ hay nhất
- Làm thế nào để tận dụng tối đa pin điện thoại thông minh của bạn
- Bạn đang đua về một bức tường. Bạn nên phanh mạnh hay là lách qua
- Một lịch sử về kế hoạch đánh bom hạt nhân vào cơn bão (và những thứ khác nữa)
- Đối với những chiến binh cầm kiếm này, những trận chiến trung cổ vẫn còn sống
- 👁 Nhận dạng khuôn mặt đột ngột xuất hiện ở mọi nơi. Bạn có nên lo lắng không? Ngoài ra, đọc tin tức mới nhất về trí tuệ nhân tạo
- ✨ Tối ưu hóa cuộc sống gia đình của bạn với những lựa chọn tốt nhất từ đội ngũ Gear của chúng tôi, từ robot hút bụi đến nệm giá rẻ đến loa thông minh.
