Компания xAI, занимающаяся разработкой искусственного интеллекта под руководством Илона Маска, в среду вечером представила свою новую флагманскую модель искусственного интеллекта Grok 4, а также анонсировала новую подписку на ИИ стоимостью 300 долларов в месяц – SuperGrok Heavy.
Grok является ответом xAI на ChatGPT от OpenAI и Gemini от Google, и способен анализировать изображения и отвечать на вопросы. За последние месяцы Grok был глубже интегрирован в социальную сеть X, недавно приобретённую xAI. Однако это также привело к тому, что случаи некорректной работы Grok стали более заметны для миллионов пользователей.
Ожидания от Grok 4 крайне высоки. Новейшая модель искусственного интеллекта от xAI будет сравниваться с грядущей моделью GPT-5 от OpenAI, запуск которой ожидается этим летом.
«Что касается академических вопросов, Grok 4 превосходит уровень PhD по всем дисциплинам, без исключений», — заявил Илон Маск во время прямой трансляции в среду вечером. — «Иногда ему может не хватать здравого смысла, и он пока не изобрёл новые технологии и не открыл новую физику, но это лишь вопрос времени».

Запуск Grok 4 происходит на фоне сложной недели для компаний Илона Маска. Ранее в среду Линда Яккарино ушла с поста генерального директора X после примерно двух лет работы в компании. На данный момент преемник на этом посту не назначен.
Уход Яккарино произошёл всего через несколько дней после того, как официальный автоматический аккаунт Grok в X ответил пользователям антисемитскими комментариями, критикуя «еврейских руководителей Голливуда» и восхваляя Гитлера. xAI была вынуждена временно ограничить работу аккаунта Grok и удалить оскорбительные публикации. В ответ на этот инцидент xAI, по-видимому, удалила недавно добавленный раздел из публичного системного промпта Grok — списка инструкций для чат-бота ИИ, в котором ему предписывалось не избегать «политически некорректных» утверждений.
Илон Маск и руководство xAI предпочли не обсуждать этот инцидент, сосредоточив внимание на производительности и возможностях Grok 4.
В среду xAI представила сразу две модели: Grok 4 и Grok 4 Heavy — последняя является «мультиагентной версией» компании, обладающей повышенной производительностью. Маск утверждает, что Grok 4 Heavy создаёт несколько агентов для одновременной работы над задачей, после чего эти агенты сопоставляют свои решения, «как учебная группа», чтобы выбрать наилучший ответ.
Компания отмечает, что Grok 4 демонстрирует передовые результаты по ряду бенчмарков, включая Humanity’s Last Exam — сложный тест, проверяющий способность искусственного интеллекта отвечать на тысячи вопросов из таких областей, как математика, гуманитарные науки и естественные науки. По данным xAI, Grok 4 набрал 25,4% на Humanity’s Last Exam без использования дополнительных инструментов, что выше, чем у Google Gemini 2.5 Pro (21,6%) и OpenAI o3 (high) (21%).
xAI также утверждает, что Grok 4 Heavy с использованием дополнительных инструментов смог набрать 44,4%, опередив Gemini 2.5 Pro с инструментами, который показал результат 26,9%.
Некоммерческая организация Arc Prize сообщает, что Grok показал рекордный результат на тесте ARC-AGI-2 — ещё одном сложном бенчмарке, в котором ИИ необходимо выявлять визуальные закономерности в задачах-головоломках — набрав 16,2%. Это почти вдвое лучше следующей лучшей коммерческой модели ИИ, Claude Opus 4.

Вместе с Grok 4 и Grok 4 Heavy компания xAI запустила и самый дорогой тарифный план подписки на ИИ — SuperGrok Heavy стоимостью 300 долларов в месяц. Подписчики получат ранний доступ к Grok 4 Heavy, а также к новым функциям по мере их появления. План аналогичен премиальным тарифам, предлагаемым OpenAI, Google и Anthropic, однако xAI теперь лидирует по стоимости среди крупнейших провайдеров ИИ.
Подписчики SuperGrok Heavy также получат возможность первыми опробовать некоторые новые продукты, запуск которых xAI планирует в ближайшие месяцы. В среду компания сообщила, что выпуск модели для программирования намечен на август, мультимодального агента — на сентябрь, а генератора видео — на октябрь.
xAI выпускает Grok 4 через свой API, чтобы стимулировать разработчиков создавать приложения на базе новой модели. Компания отмечает, что корпоративное направление xAI существует всего два месяца, однако уже прорабатываются планы по сотрудничеству с крупными облачными провайдерами для предоставления Grok через их платформы.
Несмотря на передовые результаты Grok по ряду показателей, xAI может столкнуться с трудностями в преодолении последствий недавних инцидентов, пытаясь представить Grok в качестве полноценного конкурента для ChatGPT, Claude и Gemini на корпоративном рынке. Готовы ли бизнес-клиенты воспользоваться Grok несмотря на его недостатки — вопрос остаётся открытым.
Источник: TechCrunch