Động cơ âm nhạc AI của Dynascore Viết Tracks để Phù Hợp Với Video Của Bạn

Trong một buổi demo gần đây được thực hiện qua Zoom, tôi đã theo dõi khi ứng dụng sáng tác nhạc Dynascore biến đổi toàn bộ tâm trạng cảm xúc của một video ngắn nhiều lần trong dưới một phút, mà không thay đổi một khung hình nào. Điều bắt đầu trong cuộc họp ngắn của tôi như một quảng cáo tập luyện rất nghiêm túc với một bản nhạc nghiêm túc—điều mà bạn sẽ mong đợi thấy mồ hôi neon chảy ra từ đầu vận động viên đằng sau biểu tượng Gatorade—nhanh chóng thay đổi theo một hướng hài hước hơn. Động cơ trí tuệ nhân tạo bên trong Dynascore thay đổi nhạc nền của phim hành động thành bản nhạc Sonata ánh trăng trầm bổng của Beethoven, biến đột ngột video thành một bộ phim hài hước tối tăm.
Một vài lần nhấp chuột ở cuối cửa sổ Zoom, vài giây kỹ thuật dựng hình, và tôi đang xem cùng một video với một bài hát pop hiện đại được đặt lớp lên, phù hợp với những cận cảnh mạnh mẽ trên màn hình. Lần này, kết quả cảm giác giống như một video âm nhạc.
Nếu bạn từng sản xuất một video, cho một khách hàng trả tiền hoặc cho kênh YouTube cá nhân của mình, bạn có lẽ đang ngậm nước miếng ngay bây giờ. Tất cả các nhà sản xuất video đều biết rằng những đoạn nhạc cổ điển—theo kiểu những giai điệu đã được làm trước, thường không có lời mua từ thư viện trực tuyến—phù hợp như một bộ vest mượn. Nhưng khi sự lựa chọn thay thế đã lâu là phải dành rất nhiều thời gian chỉnh sửa các bản nhạc nổi tiếng để phù hợp với nhịp điệu và chiều dài của video của bạn, nhiều biên tập video đã chấp nhận sự thuận tiện của việc chọn một đoạn âm thanh sẵn có từ kệ âm thanh ảo.
Phần mềm của Dynascore được động lực bởi trí tuệ nhân tạo có khả năng lấy một bản nhạc đã sáng tác, sau đó tự động cắt nó thành từng phần và "sáng tác lại" bài hát để phù hợp với bất kỳ video bạn đang làm việc. Nhà sản xuất có thể thử nghiệm bài hát mới ngay lập tức. Người dùng cũng có thể làm lại bất kỳ bản nhạc nào trong số hàng trăm bản nhạc cổ điển và tự sáng tác để hoàn toàn phù hợp với chiều dài và nhịp của cùng một video, enthoảng thông qua một phần mềm plugin Adobe Premiere Pro hoặc qua ứng dụng riêng của công ty. Cần một bản nhạc chuyển tiếp hoặc một đoạn kết thúc cho logo? Không vấn đề. Thích bản nhạc nhưng muốn nó xây dựng chậm hơn? Có rồi. Bởi vì nó được viết bởi một nhà soạn nhạc AI và âm nhạc hoặc là không bản quyền hoặc được viết trong nhà tại Dynascore, mỗi bản nhạc đều đi kèm với giấy phép cho phép sử dụng âm nhạc không giới hạn trên toàn thế giới.
“Tôi nghĩ điều này là không thể tin được,” nói nhà làm phim chuyên nghiệp Joseph DiGiovanna, người đã dành nhiều tháng kiểm tra phần mềm trước khi phát hành. “Sự thật là, sân đấu đã được làm phẳng 100%,” ông nói, “Đứa trẻ có chiếc điện thoại di động sẽ cạnh tranh cùng một công việc tại Vogue với tôi.”
Lemonade Giữ Khoảng Cách Xã Hội
Dynascore không tồn tại nếu năm 2020 diễn ra đúng kế hoạch. Thật không may cho nhạc sĩ New York Greg Jarrett và đối với Yunus Saatchi, người đóng vai trò nghiên cứu tại Uber AI Labs lúc đó, mọi người dừng chia sẻ xe hàng loạt vào cùng thời điểm sân khấu Broadway đóng cửa cửa. Đối với bộ đôi này, và với nhiều người trên đội ngũ sẽ giúp tạo ra Dynascore, cuộc sống dưới Covid nhanh chóng biến thành sự không chắc chắn toàn diện.

Uber đã đóng cửa bộ phận trí tuệ nhân tạo hàng đầu mà Saatchi làm việc, và buổi biểu diễn off-Broadway mà Jarrett đang làm việc làm giám đốc âm nhạc đã tạm dừng vô thời hạn.
“Chúng tôi rời đi vào cuối tuần nghĩ rằng chúng tôi sẽ trở lại vào thứ Ba,” ông nói, “Và sau đó là hai tuần. Và sau đó là bốn tuần. Và sau đó là sáu tháng.”
Saatchi nhanh chóng tìm được công việc mới, nhờ vào cuộc họp với nhà soạn nhạc Peter Lerman trong thời gian làm việc tại Uber. Howard, anh em của Peter, là doanh nhân công nghệ đã sáng lập Yext, một nền tảng tìm kiếm được trang bị trí tuệ nhân tạo. Một ý tưởng về một công cụ âm nhạc dựa trên trí tuệ nhân tạo đã đưa Saatchi vào vị trí làm việc tại Wonder Inventions, một công ty mới được ủng hộ bởi nhà sáng lập Yext.
Họ không gặp nhiều vấn đề khi tìm nhạc sĩ để soạn nhạc; Peter có mối liên kết sâu rộng với cộng đồng âm nhạc New York, và những người như Jarret cần một cái gì đó để chiếm giữ thời gian.
Với Jarrett và một nhóm nhỏ của những nhà soạn nhạc, người sắp xếp và người soạn nhạc Broadway đã nghỉ việc để viết nhạc, đội ngũ kỹ thuật của Dynascore đã tình cờ bước vào một tình huống lợi nhất khi nói đến tài năng nội bộ. Ai có thể tốt hơn để viết những tác phẩm khiến cho drama hình ảnh trỗi dậy hơn những người đã được trả tiền để làm điều đó hàng đêm?
Vấn Đề Con Người
Đôi tai vàng của những nhà soạn nhạc con người thực sự là chìa khóa quan trọng đối với sự thành công cuối cùng của Dynascore. Vấn đề lịch sử với âm nhạc dựa trên AI, hoặc “algorithmically composed”, theo Saatchi, là nó chủ yếu cố gắng dạy cho các công cụ phần mềm viết nhạc từ đầu, thay vì tái hiện những bản nhạc đã được soạn trước đó.
“Việc tạo ra nhạc thực sự gây ấn tượng với mọi người là một vấn đề của con người, vì vậy bạn phải bắt đầu từ con người,” Saatchi nói. “AI chỉ là bộ tăng áp cho con người.”
Trong những ngày đầu của Dynascore, Saatchi và nhóm đã nỗ lực phát triển một cách để phân tách âm nhạc gốc và các kiệt tác nằm ngoài bản quyền (hãy nghĩ đến “Hall of the Mountain King” của Grieg) thành các đoạn gọi là “morphones”. Họ sẽ dạy cho AI một bài hát, sau đó yêu cầu nó tái soạn một cái gì đó tương tự bằng cách sử dụng morphones của bài hát gốc như là hướng dẫn. Sau đó, họ sẽ yêu cầu những nhạc sĩ đánh giá sự soạn lại của AI.
Việc làm cho âm nhạc vừa vặn hoàn hảo trong một video không đơn giản như việc chia nhỏ các bài hát hiện tại theo cách dự đoán. Sự chuyển động tự nhiên đòi hỏi một sự hiểu biết sâu sắc hơn về âm thanh, nhịp và cường độ, cùng nhiều đặc điểm âm nhạc khác. Do đó, morphones không chỉ chỉ định tốc độ và phím của một bài hát. Chúng cũng chỉ định nhiều đặc điểm âm nhạc và âm nhạc khác nhau, tất cả đều cho phép AI biết rõ loại khối Lego âm nhạc nào snap vào nhau như thế nào.
Sau khi họ phát triển hệ thống morphone, nhóm sẽ đưa bài hát cho AI và yêu cầu nó tái soạn chúng. Mất một thời gian trước khi nó đủ chuyên môn về mặt âm nhạc để đưa ra những quyết định đúng đắn.
“AI sẽ soạn một bản nhạc, và những nhạc sĩ sẽ nói, ‘Đó là không tốt,’” Saatchi nói, cười nhạo về sự đơn giản của bài kiểm tra. “Nó nhận phản hồi đó và học từ nó, và nó đến một thời điểm nào đó, đột nhiên, nó tạo ra những bản soạn hợp lý.”
AI sớm trở nên đủ thông minh để đồng bộ các chuyển động, giảm âm, đợt và các thay đổi thời gian khác theo yêu cầu của người dùng vào mỗi bản nhạc mà nó soạn. Phiên bản của Dynascore mà tôi chứng kiến tái tạo lại Moonlight Sonata đã ra đời.
Nghỉ Ngơi Một Chút
Thành công của Dynascore đại diện cho một sự cải tiến đột phá đối với điều gì đã từng là một luồng làm việc g cumbersome theo quan điểm lịch sử.
“Khi bạn làm việc như là một biên tập viên hoặc nhà làm phim, bạn dành rất nhiều thời gian với âm nhạc, vì bạn phải làm cho nó vừa vặn từng khung hình,” nói DiGiovanna, người đã làm việc trên mọi thứ từ phim truyện đến quảng cáo truyền hình, “Với Dynascore, bạn có thể làm điều đó ngay lập tức.”
Một công cụ cho phép sáng tác âm nhạc linh hoạt là đặc biệt hữu ích khi làm việc trên các dự án thương mại nơi một số mục cụ thể có thể cần phải bị cắt giảm. DiGiovanna đưa ra một ví dụ về một đạo diễn cần loại bỏ một chiếc túi xách khỏi quảng cáo mà anh ta tạo ra.
“Bạn phải loại bỏ năm giây video, và bây giờ phần kết của bản nhạc không hoạt động, sự chuyển tiếp sang bài hát tiếp theo không hoạt động,” anh ấy nói, “Đó là lúc mà Dynascore sẽ giúp tôi tiết kiệm rất nhiều thời gian.”
Phần mềm mới mang lại cho anh ta một ưu điểm mà hầu hết các sản phẩm mới không cung cấp nhiều như vậy: thời gian. Khi được hỏi nó có thể tiết kiệm anh ta bao nhiêu thời gian một cách thực tế, anh ấy hứng thú. “Nhiều giờ, đôi khi là cả một ngày.”
Một Sự Đổi Mới Mới
Về mặt nghệ thuật chính, điều tuyệt vời nhất mà Dynascore mang đến cho các nhà làm phim mới nổi và đã thành danh là có thể thử nghiệm bao nhiêu lựa chọn âm nhạc mới cho một đoạn cụ thể. Từ nhịp hip-hop đến tái hiện các tác phẩm cổ điển nằm ngoài bản quyền, người dùng có thể chọn các không khí âm nhạc cụ thể để thử, tất cả mà không phải chịu các chi phí mà họ có thể đã phải chịu nếu không có Dynascore.
Trong trải nghiệm ban đầu của tôi với Dynascore, tôi có cơ hội thấy sự khác biệt trong kết quả khi đặt một số bài hát khác nhau lên cùng một video. Từ âm nhạc cổ điển đến nhịp hip-hop và đến một bài hát dân ca, tôi có thể có ba phiên bản khác nhau của quảng cáo tập luyện đó xuất hiện trước mắt tôi trong vài phút, mỗi phiên bản phù hợp với video.
Trước đây, tôi đã phải chọn nhạc sẵn và những bài hát đó không phải là phù hợp. Tính chất tùy chỉnh của âm thanh thực sự khiến mỗi video trở nên chuyên nghiệp hơn và ít giống như một bản demo cho một trang web nhạc sẵn.
“Khó tin là một bản nhạc có thể thay đổi cảm nhận của bạn về những gì bạn đang xem,” nhạc sĩ Jarrett nói, “Bạn có thể tạo ra một cái gì đó, và nó có thể như là, ‘Ai biết nó cũng có thể như thế này chứ?’”
Mua Một Lần, Sử Dụng Ở Bất Cứ Nơi Nào
Việc một trí tuệ nhân tạo đang tạo ra âm nhạc đặt ra một số câu hỏi về cách các nhà soạn nhạc nội bộ của Dynascore sẽ được thanh toán nếu, ví dụ, một trong những bài hát họ sáng tác ban đầu được sử dụng cho một quảng cáo Super Bowl hoặc trong trailer cho một bộ phim bom tấn. Thông thường, các dự án lớn như vậy mang lại khoản thanh toán lớn cho các nhà soạn nhạc. Lãnh đạo của Dynascore nói rằng họ cam kết xem xét những vấn đề này khi chúng xuất hiện. Hiện tại, các dự án có ngân sách lớn có lẽ sẽ tiếp tục sử dụng nhà soạn nhạc con người, nhưng không khó nhận thấy cách AI có thể ngày càng được tích hợp vào các video như những video xuất hiện trên Instagram, TikTok và YouTube.
Thực tế, giấy phép toàn cầu không giới hạn là một thành phần chính làm cho phần mềm có thể thành công, ít nhất là về sự đa nền tảng của âm nhạc mà nó cung cấp.
Việc sở hữu một giấy phép toàn cầu duy nhất, vĩnh viễn, có nghĩa là bạn có thể sử dụng những bài hát từ Dynascore ở bất cứ nơi nào bạn muốn, bất cứ khi nào bạn muốn.
“Nói chung, nếu bạn đang giao dịch với các nhà soạn nhạc Mỹ, và bạn đang xử lý những bài hát nằm trong phạm vi công cộng, bạn nên có khả năng mua lại tất cả các quyền cần thiết,” nói chuyên gia và luật sư ngành công nghiệp Donald S. Passman, tác giả của All You Need to Know About the Music Business, một trong những cuốn sách đặc trưng nhất về cấp phép.
Đúng Nhạc
Saatchi có ý tưởng rõ ràng về mức độ tốt mà anh muốn AI đạt được. “Chỉ số của tôi khi nghe là bạn không nên biết liệu một máy đã làm nó hay nó được thực hiện trong một phòng thu,” anh nói. Ít nhất là theo những gì tôi đã thấy và nghe, Dynascore đang đáp ứng tiêu chuẩn đó.
Với chất lượng của âm nhạc và giá cả phải chăng của plug-in—giờ đây chỉ còn 19 đô la mỗi tháng cho số bài không giới hạn—khó có thể tưởng tượng được làm thế nào Dynascore sẽ không chiếm đất bằng giữa các nhà sáng tạo đang khao khát một trải nghiệm âm nhạc tùy chỉnh hơn. Công ty cũng đã phát hành một API phát triển viên—một bộ công cụ sẽ cho phép những nhà phát triển phần mềm bên thứ ba sử dụng động cơ âm nhạc trong ứng dụng của họ—làm cho việc tạo nội dung trở nên dễ dàng hơn cho những người không có đăng ký Adobe.
Ngay cả DiGiovanna, người thực sự có khả năng âm nhạc để soạn nhạc cho những video anh ta tạo ra, cũng nhìn nhận Dynascore như một công cụ làm tan biến những hạn chế sáng tạo của phương tiện. “Nó như thiên đàng,” anh ta nói.
Những Điều Tuyệt Vời Nữa từ MYTOUR
- 📩 Thông tin mới nhất về công nghệ, khoa học, và nhiều hơn nữa: Đăng ký nhận bản tin của chúng tôi!
- Người huyền thoại điều hành xe máy cố gắng lừa dối nền kinh tế đồng giời
- Help! Làm thế nào để tôi chấp nhận rằng tôi đã kiệt sức?
- Cần gì để chỉnh sửa video chất lượng phòng thu tại nhà
- Thảm họa sập chung cư ở Florida báo hiệu cho cuộc sụp đổ của bê tông
- Làm thế nào sợi quang dưới lòng đất theo dõi con người ở trên
- 👁️ Khám phá trí tuệ nhân tạo như chưa bao giờ có với cơ sở dữ liệu mới của chúng tôi
- 🎮 MYTOUR Games: Nhận các mẹo, đánh giá, và nhiều hơn nữa
- 💻 Nâng cấp công việc của bạn với những chiếc laptop, bàn phím, giải pháp gõ khác, và tai nghe chống ồn yêu thích của đội ngũ Gear của chúng tôi
