Наверняка каждый из наших читателей хотя бы раз слышал о нейросетях ChatGPT и Dall-E 3, созданных OpenAI. Эта всемирно известная компания скоро порадует пользователей еще одним инструментом — многообещающей нейросетью под названием Sora.
Нейросеть Sora: новая эра в сфере видеотехнологий
Что же такое Sora, и почему тут и там только о ней и говорят? Sora (в переводе с японского языка это слово означает “небо”) представляет собой модель, которая создает видео по текстовым промптам. Длительность создаваемых моделью видео составляет до 60 секунд. Ее обучение происходит на огромном количестве реальных видеороликов пользователей Сети. Помимо текстовых запросов, нейросеть будет способна генерировать видео также и по другим роликам или же изображениям.
В настоящее время нейронная сеть Sora закрыта от широкой публики. Доступом к ней обладают только сами разработчики, а также узкий круг специалистов — тестировщиков, дизайнеров и других. Пока что компания OpenAI не называет точных дат, когда эта модель станет общедоступной. Однако уже сегодня можно ознакомиться с тем, какие видео генерирует нейронная сеть. Качество роликов поражает воображение. Видео, созданные Sora, набирают миллионные просмотры от пользователей.
Кстати, Сэм Альтман, занимающий пост главного исполнительного директора OpenAI, в своем Х (ранее — Твиттере) с охотой делится с другими пользователями результатами работы Sora. Поклонники новых технологий присылают ему свои промпты, а в ответ на них Альтман публикует сгенерированные моделью видео.
Главный плюс нейросети
Sora отличается тем, что ее алгоритмы позволяют создавать максимально реалистичные изображения, которые значительно превосходят по качеству работы конкурентов. Одной из главных проблем современных нейросетей для генерации видео является их неспособность воссоздавать с нуля правдоподобных людей, животных, пейзажи и прочие объекты. Однако Sora демонстрирует высокую точность в создании визуального контента, а некоторые кадры, сгенерированные этой нейросетью, настолько реалистичны, что их сложно отличить от настоящей съемки.
Примеры генераций
Одним из наиболее популярных видео, сгенерированных при помощи обозреваемой нейронной сети, стал ролик, открывающийся кадрами танцующего кенгуру. В нем также можно увидеть забавных щенков ретривера, играющихся в снегу, трейлер к приключенческому кинофильму и ряд прочих генераций:
Один из популярных видеороликов, которые можно увидеть на странице Альтмана, был создан по промпту «A bicycle race on ocean with different animals as athletes riding the bicycles with drone camera view» («Велосипедная гонка по океану с различными животными в качестве спортсменов, едущих на велосипедах, с камеры беспилотника»).
А вот видео, опубликованное сотрудником Open AI Б. Пиблзом. Оно было создано Sora по запросу «an alien blending in naturally with new york city, paranoia thriller style, 35mm film» («Инопланетянин, естественно вписавшийся в Нью-Йорк, триллер в стиле паранойи, 35-миллиметровая пленка»):
Не станет ли Sora опасной?
Немало пользователей в связи с возникновением столь прогрессивной технологии считают, что она может стать опасной. Ведь те возможности, которые предоставляет Sora, могут также использовать злоумышленники в своих коварных целях. Даже если говорить о тех генераторах изображений, которые пользуются популярностью сегодня, к ним уже не раз возникало множество вопросов. К примеру, как в случае генерации фотографий с папой Римским в белом пуховике, сгенерированной нейросетью Midjourney. Это изображение оказалось настолько реалистичным, что в результате опроса блогера Х. Грина в реальность фото поверило более половины пользователей (аудитория данного блогера составляет свыше 1,5 млн. человек).
Изображение: Lavanguardia.com, https://www.lavanguardia.com/tecnologia/20230328/8859266/creador-imagen-viral-papa-francisco-chaqueta-deep-fake-pmv.html
Однако OpenAI прилагает все усилия к тому, чтобы сделать свой продукт максимально безопасным. В настоящее время сотрудники компании занимаются разработкой инструментов, которые помогут определять фейковый и потенциально опасный контент.
Таким образом, нейросеть Sora обещает кардинально изменить наши представления о создании видео. Впереди нас ждут новые открытия, и то, что сегодня кажется необычным, наверняка скоро станет частью повседневной жизни. Модели ИИ, подобные нейросети Sora, начинают формировать будущее видеопроизводства уже сейчас.