Компания Stability AI объявила о выпуске Stable Diffusion 3.5, что стало значительным шагом вперед в развитии моделей генерации изображений на основе открытого ИИ.
Последние модели от Stability AI включают несколько вариантов, разработанных для удовлетворения различных потребностей пользователей — от любителей до корпоративных приложений.
Это объявление последовало за выпуском Stable Diffusion 3 Medium в июне, который, по признанию компании, не оправдал ожиданий.
«Этот релиз не полностью соответствовал нашим стандартам или ожиданиям нашего сообщества», — заявили в Stability AI.
Вместо того чтобы торопиться с быстрым исправлением, Stability AI утверждает, что потратила время на разработку более надежного решения.
Представляем Stable Diffusion 3.5 — наши самые мощные модели на сегодняшний день.
Этот открытый релиз включает несколько вариантов, которые можно гибко настроить по размеру, они работают на потребительском оборудовании и бесплатны как для коммерческого, так и для некоммерческого использования на условиях Stability AI Community License.
Вы уже можете загрузить Stable Diffusion 3.5 Large и Stable Diffusion 3.5 Large Turbo с Hugging Face, а исходный код для инференса — на GitHub. Stable Diffusion 3.5 Medium будет выпущена 29 октября.
— Stability AI (@StabilityAI) 22 октября 2024 г.
Флагманская модель Stable Diffusion 3.5 Large содержит 8 миллиардов параметров и работает с разрешением в 1 мегапиксель, что делает её самой мощной в семействе Stable Diffusion. Вместе с ней доступен вариант Large Turbo, который обеспечивает сопоставимое качество, но генерирует изображения всего за четыре шага, что значительно сокращает время обработки.
Версия Medium, выпуск которой запланирован на 29 октября, будет иметь 2,5 миллиарда параметров и поддерживать генерацию изображений с разрешением от 0,25 до 2 мегапикселей. Этот вариант специально оптимизирован для пользовательского оборудования.
Модели используют нормализацию Query-Key в трансформерах, что улучшает стабильность обучения и упрощает настройку. Однако эта гибкость влечет за собой некоторые компромиссы, включая большее разнообразие результатов при идентичных запросах, но с разными семенами случайных чисел.
Stability AI внедрила крайне разрешительную лицензию для сообщества для этого релиза. Модели бесплатны для некоммерческого использования и доступны для компаний с годовыми доходами менее 1 миллиона долларов. Предприятия, превышающие этот порог, должны заключать отдельные лицензионные соглашения.
Компания подчеркнула свою приверженность ответственному развитию ИИ, внедряя меры безопасности на ранних этапах. Планируется выпуск дополнительных функций, включая ControlNets для расширенного управления функционалом, после запуска версии Medium.
Последние модели Stability AI для генерации изображений уже доступны на Hugging Face и GitHub, а также через платформы, включающие API Stability AI, Replicate, ComfyUI и DeepInfra.
Источник: Artificial Intelligence News