OpenAI представила Sora 2 – платформу, которая одновременно является продвинутой нейросетью для создания видео и социальным приложением. Два отдельных продукта объединили под одним названием: модель генерирует видео и аудио из текстовых описаний, приложение превращает эту технологию в социальную сеть для ремиксов AI-контента.
Модель научилась генерировать синхронизированный звук: диалоги, фоновые шумы, звуковые эффекты. Весь процесс происходит автоматически, без склейки аудио постфактум. Система предлагает юзерам немало серьезных преимуществ; раньше подобные возможности были доступны только в Google Veo 3. Но очевидные минусы у модели тоже имеются.
Физика и непрерывность: что изменилось в модели
Разработчики заявляют, что новоиспеченная Sora 2 стала лучше понимать физические законы. Предыдущие модели часто жульничали: если баскетболист промахивался мимо кольца, мяч мог телепортироваться прямо в корзину. Теперь система моделирует реальное поведение – мяч отскакивает от щита, падает на пол. Для создания убедительных сцен критично важная деталь, и модель их учитывает.
Модель научилась генерировать ошибки. Старые системы показывали только успешные действия – скейтбордист всегда приземлялся на доску, гимнаст всегда выполнял элемент чисто. Sora 2 может показать падение, неудачную попытку, потерю равновесия. Реалистичные провалы требуют глубокого понимания физики и человеческого поведения. К слову, для съемок опасных трюков такая возможность будет очень полезной, ведь в данном случае не придется рисковать живыми людьми.
Третье улучшение касается непрерывности. Система должна удерживать постоянство персонажа, освещения и обстановки на протяжении нескольких кадров. Если в промпте указано, что человек в красной куртке входит в здание, идет по коридору и берет газету, куртка должна оставаться красной, коридор – тем же самым, а газет не должно внезапно стать три. На практике все это функционирует с переменным успехом. В демонстрационных роликах лица персонажей остаются узнаваемыми, освещение держится, но расстояния между объектами могут плавать, а камера иногда непредсказуемо прыгает.
Приложение Sora 2. AI, который встретился с ТикТок
Параллельно с моделью OpenAI запустила iOS-приложение Sora — социальную платформу для обмена AI-видео. Доступ пока только по инвайтам и только в США и Канаде. Центральная фишка приложения — функция «камео». Пользователь записывает короткое видео с собой, и система запоминает внешность и голос. После можно вставлять себя в любую сгенерированную сцену: оказаться в средневековом замке, на борту космического корабля или рядом с йети. Разработчики видят в этом новую форму коммуникации — шаг после голосовых сообщений.
Для подростков введены ограничения: лимит на количество просмотренных роликов в день, более строгие правила использования камео, родительский контроль через ChatGPT. Команда модерации следит за случаями буллинга. Монетизация минималистична: если спрос превысит доступные вычислительные мощности, пользователи смогут доплатить за дополнительные генерации. Никакой рекламы или подписок с автопродлением.
Минусы и реальные возможности
Пока что, несмотря на плюсы, Sora 2 остается сырой технологией. Долгосрочная непрерывность не гарантирована – сложные сюжеты с множеством монтажных переходов все еще могут сбиться. Система плохо справляется с детализацией рук и встроенным текстом в кадре. Если нужен читаемый шрифт на афише или упаковке, лучше добавлять его отдельно в графическом редакторе. OpenAI не публикует подробных списков слабых мест, но предупреждает: модель далека от совершенства.
Доступ расширяется постепенно. iOS-приложение уже можно скачать, однако активация происходит по волнам инвайтов. Владельцы ChatGPT Pro получат доступ к экспериментальной версии Sora 2 Pro с улучшенным качеством. Планируется запуск API, при этом конкретных дат и цен нет. Первое время платформа будет бесплатной с щедрыми лимитами; но и тут есть минус – они зависят от загрузки серверов. Версия для Android на данном этапе отсутствует.
По сравнению с конкурентами (например, Runway Gen 4), Sora 2 выигрывает в нативной генерации звука и обещает более точное следование сложным промптам. Runway предлагает более зрелую экосистему инструментов редактирования, а также более удобную систему оплаты. Конечно, на данном этапе параллельно развиваются и Google Veo, Luma Dream Machine, Pika и другие ресурсы, однако данных для сравнения все же пока недостаточно.
OpenAI во многом придерживается принципов безопасности: ограничены загрузки фотореалистичных изображений людей, введены механизмы защиты несовершеннолетних, добавлены водяные знаки для идентификации AI-контента. Пользователи полностью контролируют свои камео – могут отозвать доступ в любой момент, удалить видео с их участием, видеть все черновики, в которых использовалась их внешность.
Наш вердикт
Таким образом, Sora 2 стала значительным скачком вперед, однако далеко не финальной версией лучшего видеогенератора. Модель способна на сложные вещи: олимпийские гимнастические упражнения, сальто на доске для серфинга с реалистичной физикой воды, тройные акселя с котом на голове – все это ей дается неплохо. Однако до полноценного симулятора реальности еще далеко. Разработчики открыто признают: модель делает множество ошибок, но каждая итерация приближает технологию к цели. Пока же Sora 2 остается довольно интересным инструментом для творческих экспериментов.









Разработчики открыто признают: модель делает множество ошибок, но каждая итерация приближает технологию к цели. Пока же Sora 2 остается довольно интересным инструментом для творческих экспериментов.
Все компанй продвигаются вперед по разработкам технологий.Молодцы.
В сравнении с предыдущей версией, Sora 2 обещает более правдоподобную физику движения, реалистичное взаимодействие объектов, синхронизацию звука и видео что для многих интригующая информация.