Компания Google DeepMind собирает новую команду исследователей в области искусственного интеллекта для разработки «мировых моделей», которые могут симулировать физические окружения. Руководителем инициативы станет Тим Брукс, бывший со-лидер проекта Sora в OpenAI, который присоединился к DeepMind в октябре для работы над генерацией видео и мировыми симуляторами Google.
Мировые модели являются относительно новым направлением в области ИИ и могут служить различным целям, таким как создание интерактивных медиа-сред в реальном времени для видеоигр и фильмов, а также реалистичных тренировочных сценариев для роботов и других систем ИИ. Это также часть стремления Google достичь системы общего искусственного интеллекта (AGI) прежде своих конкурентов.
«DeepMind имеет амбициозные планы по созданию огромных генеративных моделей, которые симулируют мир,» заявил Брукс в посте на X в понедельник. Брукс включил в пост два открытых объявления о вакансиях для инженеров-исследователей и ученых, которые помогут продвигать «мировые модели» ИИ, способные симулировать реальные сценарии, решая проблемы масштаба тренировки, курируя данные для обучения и изучая их интеграцию с мультимодальными языковыми моделями.
«Мы считаем, что масштабирование предварительного обучения на видео и мультимодальных данных является критическим шагом на пути к общему искусственному интеллекту,» говорится в описании вакансий от DeepMind. «Мировые модели будут применяться во многих областях, таких как визуальное рассуждение и симуляция, планирование для воплощенных агентов и интерактивные развлечения в реальном времени.»
Гонка за первенство в области AGI набирает обороты, так что фокус Google в этом направлении не удивителен. Генеральный директор OpenAI Сэм Альтман недавно заявил, что компания раскрыла, как достичь долгожданной в индустрии технологии отметки, и что автономные ИИ-агенты могут начать существенное участие в рабочей силе уже в этом году.
Новая команда DeepMind будет работать в сотрудничестве с существующими проектами Google AI, включая флагманские модели Gemini AI, генератор видео Veo и Genie — прежнюю мировую модель Google для симуляции играбельных 3D-сред в реальном времени.
Источник: The Verge