Модель Genie 3. Google DeepMind показывает, как выглядит будущее виртуальных миров

23.02.202622.02.2026

Недавно компания Google DeepMind представила Genie 3, очередную итерацию своей модели, которая на этот раз научилась генерировать интерактивные миры непосредственно в режиме реального времени. Это новая продвинутая ИИ-модель, предназначенная для создания виртуальных 3D-окружений на основе предоставленного текста. Она не ограничивается статичной картинкой или видео, а создает играбельную среду, по которой можно перемещаться и взаимодействовать с объектами. Точно так, как это происходит в игре или симуляции.

Если предыдущие версии умели создавать статичные сцены, то с новой моделью можно взаимодействовать с виртуальной реальностью прямо в процессе ее генерации. Технология работает со скоростью 20-24 кадров в секунду, поэтому взаимодействие с ней является достаточно плавным для комфортного использования. Разработчики потратили годы на исследования в области симулированных окружений, и в данный момент их система реагирует на действия пользователя практически мгновенно.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео RuTube ОК

Мир, который помнит прошлое

Главная техническая сложность Genie ранее заключалась в том, чтобы модель могла отслеживать всю историю действий пользователя и созданного окружения. Когда человек возвращается в локацию, которую посещал минуту назад, Genie 3 должна вспомнить, как это место выглядело. Сейчас система анализирует предыдущую траекторию движения несколько раз в секунду, реагируя на новые команды. Визуальная память модели простирается на целую минуту назад, что для автоматически генерируемого мира является впечатляющим показателем. При этом каждый новый кадр создается с учетом всей предшествующей последовательности, которая постоянно растет по мере создания виртуального пространства.

В отличие от других технологий, которые требуют явного 3D-представления пространства (например, NeRF или Gaussian Splatting), Genie 3 создает окружение кадр за кадром на основе описания мира и действий пользователя. Создаваемые моделью миры являются более динамичными и богатыми по содержанию, но при этом задача по поддержанию однородности несколько усложняется. Со временем, конечно, ошибки при автоматической генерации накапливаются, этого не избежать; однако сейчас разработчикам удалось добиться стабильности на протяжении нескольких минут непрерывного взаимодействия. На данный момент окружения остаются физически последовательными даже при длительной работе.

Отметим, что модель является экспериментальной. Пока что доступ к проекту предоставляется в ограниченном режиме: он открыт только для подписчиков сервиса Google AI Ultra в США и предназначен для пользователей старше 18 лет. Такой формат распространения подчеркивает тестовый характер технологии, которая рассматривается в качестве перспективного направления развития систем ИИ типа «world model» (моделирования мира).

Погода по запросу и другие эксперименты

Помимо навигационных команд, Genie 3 поддерживает текстовое управление событиями внутри созданного пространства. DeepMind называет это программируемыми событиями мира; звучит немного заумно, но суть проста. Можно попросить модель изменить погоду, добавить новые объекты или персонажей прямо в процессе исследования виртуального пространства. Технология открывает интересные возможности для обучения AI-агентов: система умеет генерировать сценарии с различными вариантами развития событий, и это помогает роботам или автономным системам готовиться к неожиданным ситуациям.

Ограничения, о которых стоит знать

Фотореалистичное качество изображения на разрешении 720p выглядит убедительно, но у технологии есть очевидные слабые места. Диапазон действий, которые агент может выполнять напрямую, пока ограничен. Программируемые события позволяют менять окружение, но их выполняет не сам агент, а система по текстовой команде. Моделирование сложных взаимодействий между несколькими независимыми агентами остается проблемой. Каждый агент должен действовать автономно, но при этом влиять на общее окружение, и эту задачу пока не удалось решить полностью.

Genie 3 не умеет точно воспроизводить реальные географические локации, модель скорее создает правдоподобные, но вымышленные места. Рендеринг текста тоже хромает: четкие надписи появляются в основном тогда, когда они заранее описаны в исходных параметрах мира. Длительность непрерывного взаимодействия пока ограничена несколькими минутами, а не часами, как хотелось бы для полноценного погружения. Впрочем, даже такая продолжительность уже позволяет решать многие исследовательские задачи и тестировать поведение AI-агентов в различных условиях.

DeepMind представляет свою работу в качестве важного шага на пути к общему ИИ. Способность модели предсказывать, как окружение будет развиваться в ответ на действия, действительно напоминает базовое понимание физического мира. Команда видит потенциал в образовательных приложениях, в которых школьники или студенты могли бы исследовать исторические эпохи или отдаленные территории без необходимости физически там находиться. Также в будущем модель может применяться и для обучения экспертов различных областей, для отработки тех или иных навыков в безопасной симулированной среде.

В настоящее время компания собирает обратную связь от специалистов, а в будущем планирует постепенно расширять доступ к платформе. Предыдущие модели семейства Genie уже умели генерировать новые окружения для агентов, а видеомодели Veo 2 и Veo 3 продемонстрировали глубокое понимание физических законов реального мира. Новая версия объединяет эти наработки, но при этом в нее добавлена интерактивность, а потому статичная генерация посредством данной модели превращается в живой, отзывчивый мир. Эксперты Креатор Проджект считают, что в перспективе подобные системы способны стать основой для новых форм моделирования и виртуального взаимодействия человека с искусственным интеллектом.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

4 комментария к “Модель Genie 3. Google DeepMind показывает, как выглядит будущее виртуальных миров”

Саша:

23.02.2026 в 15:46

В целом, Genie 3 демонстрирует, что будущее виртуальных миров может быть очень гибким, динамичным и управляемым ИИ — от игры до реальных симуляций для науки и бизнеса.
Азат:

24.02.2026 в 09:28

Команда видит потенциал в образовательных приложениях, в которых школьники или студенты могли бы исследовать исторические эпохи или отдаленные территории без необходимости физически там находиться.Что то есть полезное.
Андрей Седов:

24.02.2026 в 10:14

Это важный шаг вперёд в развитии виртуальных миров. Она демонстрирует, насколько мощными могут быть современные ИИ — решения и как они способны изменить наш опыт взаимодействия с цифровыми средами. Для меня статья стала поводом задуматься о будущем: как скоро виртуальные миры станут неотъемлемой частью нашей жизни и какие вызовы это принесёт? Безусловно, технологии открывают огромные возможности, но важно помнить и о потенциальных рисках. Я рекомендую статью всем, кто интересуется развитием ИИ, играми и виртуальными мирами. Она даёт хорошее представление о том, куда движется индустрия и что нас может ждать в ближайшем будущем. Genie 3 выглядит как серьёзный претендент на изменение ландшафта виртуальных миров.
Екатерина:

14.03.2026 в 07:20

Сложно все. Разработчики потратили много времени, сил и ресурсов для создания модели Genie 3. Преодолели массу сложностей в обучении представления физического мира и его законов. А для чего? Для игр и симуляций — с какой конечной целью? Для возможности побывать там, куда физически попасть невозможно? Непонятна конечная цель разработок.

Обсуждение закрыто.

Рекомендуем почитать

Вывеска на дата-центре Google в Мидлотиане, штат Техас, США, пятница, 14 ноября 2025 года

Google выпустила на iOS офлайн‑приложение для диктовки Google AI Edge Eloquent

Google без лишнего шума выпустила на iOS ориентированное на работу офлайн приложение для диктовки под названием «Google AI Edge Eloquent»,…

Лип-Бу Тан и Илон Маск

Intel присоединяется к проекту чипов Terafab Илона Маска

Intel присоединится к SpaceX и Tesla в усилиях по строительству нового американского завода по производству полупроводников в Техасе, хотя масштабы…

Gemini 3.1 Flash-Lite

Google представила Gemini 3.1 Flash-Lite: ставка на скорость и дешевизну

Разработчики Google выкатили очередное пополнение в семействе Gemini – модель под названием 3.1 Flash-Lite, которую представляют в качестве самого быстрого…

GPT-5.4

GPT-5.4 и GPT-5.3. Как эволюционируют кодинговые агенты OpenAI

Недавно представленная компанией OpenAI модель GPT-5.4 объединила в себе аналитические способности версии 5.2 с кодинговыми навыками линейки 5.3 Codex. Получился…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности