Hitech logo

Тренды

Вышла Stable Audio 2.0 для генерации трехминутных песен

TODO:
Дарина Житова4 апреля, 10:28

Стартап Stability AI представил языковую модель Stable Audio 2.0, которая позволяет генерировать полноценные музыкальные треки из аудиозаписи и подсказок, а также добавлять в них звуковые эффекты. Продолжительность итогового продукта около 3 минут, что равно стандартной песне на радио. Однако эксперты встретили новинку весьма холодно: они считают, что ИИ-треки становятся длиннее, но не лучше.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Первая версия Stable Audio генерировала файлы продолжительностью в 90 секунд, которые подходили скорее для баловства, чем для коммерческого применения. Пришедшая ей на смену модель создаёт полноценные песни с вокалом и классической структурой: куплетами, припевом и финалом. Можно изменять вес подсказки подобно тому, как такая функция работает в Midjourney. Возможно, она и была подсмотрена там: ранее в этом месяце последняя компания обвиняла Stability AI в попытке кражи данных.

Главное достоинство Stable Audio 2.0 — решенный вопрос с авторскими правами. Stability AI обучала модель на более чем 800 тысячах записей в музыкальной библиотеки AudioSparx, причём исполнители могли запретить использовать свои работы. Кроме того, компания заключила контракт с Audible Magic и использует технологии распознания контента, защищённого авторским правом. Использовать в качестве исходника песню известного артиста уже не получится. Это упрощает использование полученных треков с целью извлечения прибыли.

Журналисты The Verge уже протестировали новинку и явно не в восторге от неё: мелодия весьма хороша и ритмична, но вокал звучит ужасающе неестественно и похож на голоса монстров из фильмов ужасов. Одному из экспертов он напомнил песни китов. Файлы с вокалом звучат неприятно для человеческого слуха, зато мелодии без слов вполне приличные и их можно использовать, например, для озвучивания роликов на YouTube.

Stable Audio 2.0 полностью бесплатна и доступна всем желающим на сайте и по API.