Может ли Veo 3 от Google стать началом эры воспроизводимых мировых моделей?

Может ли Veo 3 от Google стать началом эры воспроизводимых мировых моделей?

Генеральный директор Google DeepMind, занимающейся исследованиями в области искусственного интеллекта, Демис Хассабис, во вторник вечером намекнул, что Veo 3 — новейшая модель Google для генерации видео — потенциально может быть использована в видеоиграх.

В ответ на пост в X с просьбой к Google «Дайте уже поиграть в видеоигру из моих видеороликов Veo 3» и вопросом: «Когда будут воспроизводимые мировые модели?», Хассабис ответил: «А это было бы интересно».

В среду утром Логан Килпатрик, руководитель продукта Google AI Studio и Gemini API, добавил в комментариях: «🤐🤐🤐🤐».

Оба сообщения носят скорее игровой характер, и представитель Google сообщил, что компании пока нечего сообщить по этому поводу. Тем не менее, создание воспроизводимых моделей мира не выходит за рамки возможностей этого технологического гиганта.

Мировые модели отличаются от моделей генерации видео. Первые симулируют динамику реальной среды, позволяя агентам предсказывать, как изменится мир в ответ на их действия. Модели генерации видео синтезируют реалистичные видеоролики.

У Google есть планы превратить свою мультимодальную базовую модель Gemini 2.5 Pro в мировую модель, способную симулировать аспекты работы человеческого мозга. В декабре DeepMind представила Genie 2 — модель, способную генерировать «бесконечное» разнообразие игровых миров. В следующем месяце было сообщено, что Google формирует новую команду для разработки ИИ, моделирующих реальный мир.

Над созданием мировых моделей работают и другие — в частности, пионер искусственного интеллекта Фэй-Фэй Ли. В прошлом году она вышла из тени со стартапом World Labs, разработавшим ИИ-систему, создающую трёхмерные игровые сцены по одной картинке.

Veo 3, всё ещё находящаяся в открытом доступе для ознакомления, может создавать не только видео, но и аудиосопровождение — от речи до саундтреков. Несмотря на то что Veo 3 обеспечивает реалистичные движения, симулируя физику реального мира, эта модель ещё не является полноценной мировой моделью. На данный момент она может использоваться для кинематографического сторителлинга в играх — для кат-сцен, трейлеров и прототипирования сюжетов.

Кроме того, на текущий момент модель Veo 3 — это всё ещё так называемая «пассивная генеративная модель». Чтобы перейти к созданию игровых миров, требуется эволюция к более активному, интерактивному и предсказательному симулятору.

Тем не менее, основная проблема производства видеоигр связана не только с впечатляющей графикой, но и с возможностью реализовать симуляцию, работающую в реальном времени, последовательно и управляемо. Поэтому разумно предположить, что в будущем Google может реализовать гибридный подход, объединяющий возможности Veo и Genie, если компания решит создать поколение игровых или воспроизводимых мировых моделей.

Google может столкнуться с конкуренцией со стороны Microsoft, Scenario, Runway, Pika, а в дальнейшем — с видео-генерирующей моделью Sora от OpenAI.

Учитывая амбиции Google в области мировых моделей и репутацию компании, способной использовать свои финансовые и дистрибьюторские ресурсы для вытеснения конкурентов, игрокам этого рынка стоит внимательно следить за её действиями.

Источник: TechCrunch

Интересно? Поделиться:

5 комментариев к “Может ли Veo 3 от Google стать началом эры воспроизводимых мировых моделей?

  1. Veo 3 от Google может стать важным шагом к созданию воспроизводимых мировых моделей, благодаря своим возможностям моделирования и ИИ. Если развивать её дальше, она может открыть новые горизонты в виртуальных мирах, обучении и симуляциях.

  2. Интересная перспектива — если Veo 3 действительно сможет генерировать детализированные и устойчивые мировые модели, это может стать прорывом не только для геймдева, но и для симуляций, обучения ИИ и виртуальной реальности. Главное — стабильность и точность воспроизведения.

  3. Однако, для полноценного становления эры воспроизводимых мировых моделей необходимо преодолеть ряд технических и этических вызовов, таких как обработка великих данных, обеспечение приватности и снижение вычислительных затрат. В целом, Veo 3 может стать первым шагом к новой эпохе в цифровом моделировании, если удастся успешно справиться с данными проблемами.

  4. Вот это поворот. Сначала генерируем видео, потом саундтрек под него, а через пару лет, глядишь, будем жить внутри ИИ-вселенной, которую можно перезапускать по одному слову. угает. Пугающе и одновременно круто

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять