Stability AI представила аудиомодели Stable Audio 3.0 для генерации музыки длиной более шести минут

Stability AI, компания, стоящая за Stable Diffusion, выпустила новое семейство аудиомоделей под названием Stability Audio 3.0. По заявлению компании, старшая модель может генерировать музыку профессионального уровня продолжительностью более шести минут.

Компания представила четыре новые модели под брендом Stable Audio 3.0: small SFX (459 млн параметров), small (459 млн параметров), medium (1,4 млрд параметров) и large (2,7 млрд параметров). Две малые модели подходят для генерации звуков и музыки на устройстве продолжительностью до двух минут.

Смотрите видео на удобном для вас ресурсе!

Модели medium и large способны создавать полноценные композиции длительностью 6 минут 20 секунд, сохраняя музыкальную структуру и мелодический характер. Это более чем вдвое превышает длительность того, что могла генерировать Stable Audio 2.0, выпущенная в 2024 году.

Stability AI делает модели small SFX, small и medium доступными с открытыми весами для использования и модификации любыми желающими. В 2024 году компания выпустила Stable Audio Open, которая позволяла генерировать музыку продолжительностью до 47 секунд. Новое семейство моделей это большой шаг вперед по сравнению с предыдущими открытыми версиями.

Модель large доступна только через API и платные сервисы самостоятельного хостинга. Кроме того, компаниям с выручкой более 1 млн долларов потребуется получить корпоративную лицензию.

Источник изображения: Stability AI

Многие компании, включая Google и ElevenLabs, выпускают модели и инструменты для генерации музыки. Однако, как показали продолжающиеся судебные разбирательства Suno и Udio, лицензирование данных и партнерства с музыкальными лейблами могут стать ключевой частью долгосрочного выживания таких сервисов.

В прошлом году Stability AI заключила соглашения с Warner Music Group и Universal Music Group о разработке моделей и инструментов для создания музыки. Компания заявила, что ее новый набор аудиомоделей построен на полностью лицензированных данных.

AI-стартап разрабатывает новый набор продуктов для профессиональных музыкантов, но не раскрыл дополнительных подробностей об их функциях. Итан Каплан, бывший директор по цифровым технологиям Universal Audio и Fender, присоединяется к компании, чтобы возглавить профессиональное музыкальное направление Stability.

Ряд AI-компаний пытается укрепить свою репутацию, нанимая руководителей из музыкальной индустрии. Ранее в этом году Suno наняла бывшего CEO Merlin Джереми Сироту на должность коммерческого директора. ElevenLabs также наняла Дерека Курнуайе из независимого музыкального издательства Kobalt в качестве руководителя по стратегии своего музыкального бизнеса.

Источник: TechCrunch

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

8 комментариев к “Stability AI представила аудиомодели Stable Audio 3.0 для генерации музыки длиной более шести минут

  1. Появление Stable Audio 3.0 показывает, что генеративная музыка переходит из стадии «коротких AI-лупов» к созданию почти полноценных треков с развитием и структурой.

  2. Ну вот, наконец-то: музыку теперь будут генерировать не на основе всего подряд из интернета, а по-честному, с разрешения самих лейблов. Видимо, ИИ всё-таки можно научить не воровать, а договариваться, даже в музыкальной индустрии.

  3. Я протестировал Small и Medium через Hugging Face. Впечатления: Small: легко запускается на моём ноутбуке (i5, 16 ГБ ОЗУ). Генерирует простые, но приятные треки до 2 минут. Подходит для фоновой музыки в видео. Medium: требует чуть больше ресурсов, но выдаёт более сложные композиции с чётким развитием. 6 минут это реально, хотя к концу иногда проскальзывают повторы. Аудио инпейнтинг: работает как магия. Выделил неудачный фрагмент, перегенерил, получилось органично.
    Особенно порадовал подход к лицензированию: я могу взять сгенерированный трек, добавить вокал, выложить на YouTube и монетизировать без страха получить страйк.

  4. Шесть минут для AI-генерации — это уже серьёзный шаг. Интересно, насколько модель держит структуру трека на длинной дистанции, а не просто повторяет удачные куски по кругу.

  5. Я, честно говоря, в полном восторге от того, что делает Stability AI. Их новая аудиомодель, Stable Audio 3.0, – это просто прорыв. Раньше, когда я слышала про генерацию музыки ИИ, это были какие-то короткие отрывки, которые звучали, ну, скажем так, «синтетически». А тут – целые композиции, да еще и длиной более шести минут! Это уже совсем другой уровень.

  6. Да сгенерированных клипов и треков заметно прибавилось в сети. И качество отличное.Вот кто оказывается может в этом помогать — Stability Audio 3.0. Треки длиной в 6 минут это уже основа для полноценного клипа (+вокал, + видео — тоже можно уже генерировать). Лицензирование мне непонятно, компания что-то не сильно раскрывает этот вопрос. Но если, как пишут выше, клип принимается и монетизируется на Ютуб, значит с этим вопросом тоже порядок., отлично.

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рекомендуем почитать

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять
Политика конфиденциальности