Всего через девять месяцев (как символично!) после релиза оригинального Grok компания xAI Илона Маска представила Grok 4 — модель, которая претендует на звание самой интеллектуальной в мире. Амбициозные заявления создателей о том, что новая система превосходит уровень, соответствующий ученой степени PhD, в любой области знаний, сразу привлекли внимание индустрии.
Но за громкими словами стоят действительно впечатляющие технические достижения: контекстное окно в 256 тысяч токенов, постоянно активный режим рассуждений Think и уникальная версия Heavy, которая запускает пять агентов Grok 4 параллельно для решения самых сложных задач.
Технические характеристики новой модели
Архитектурные улучшения Grok 4 основываются на фундаментальном увеличении вычислительных ресурсов нейросети. Компания заявляет о стократном росте объема данных по сравнению с Grok 2 и десятикратном увеличении вычислительной мощности для обучения с подкреплением. Несложно догадаться, что эти инвестиции в инфраструктуру немедленно отразились на результатах независимых тестов в области логики и программирования.
В том, что касается решения математических задач и формальной логики Grok 4 теперь соответствует уровню выпускных работ университетов. Модель лишь немного отстает от серии o-моделей OpenAI в математических соревнованиях высочайшего уровня.
Особенно впечатляют результаты версии Heavy на тестах HLE и ARC-AGI-2 — двух стресс-тестах рассуждений, в которых модель показала результаты в два раза лучше ближайших конкурентов. А еще сильной стороной модели стало программирование. В практических задачах по кодингу Grok 4 почти что сравнялась с Claude Opus 4 и o3 в исправлении багов с использованием агентных подходов.
По бенчмарку Aider, который измеряет способность писать и редактировать код, Grok 4 Heavy заняла четвертое место с результатом 79.6% правильно решенных задач, уступив только топовым версиям o3 и Gemini 2.5 Pro.
С написанием текстов нейронная сеть также справляется неплохо:
Внедрение нейросети. Где применяется Grok 4
Одним словом, модель Grok 4 выглядит впечатляюще. В каких же областях она получила наибольшую востребованность? Скажем так: пока что картина получается неоднозначная, но местами действительно захватывающая. Уже сейчас эта нейросеть с успехом начала использоваться в различных сферах. Например, немало компаний финансового сектора уже начали экспериментировать с большим контекстным окном модели. Возможность загрузить гигабайты отчетности и получить анализ за минуты позволяет сэкономить немало средств корпорациям, использующим новый Grok. Когда задача поставлена правильно, результат действительно может удивить — система находит связи между данными, которые аналитики могли упустить.
С успехом используется модель и в игровой индустрии (в первую очередь, речь идет о версии Heavy). Создание прототипов уровней за несколько часов стало реальностью, хотя, конечно, итоговый код часто требует серьезной доработки. Система генерирует рабочие решения, но они редко бывают оптимальными. Зато для быстрого прототипирования и проверки идей это настоящая находка.
Стоимость и место на рынке
Ценовая политика xAI выглядит продуманной попыткой завоевать разные сегменты рынка одновременно. API по $3 за миллион входящих токенов не самый дешевый вариант, но и не кусается. Heavy за $300 в месяц — уже серьезные деньги, которые оправданы только при действительно интенсивном использовании мультиагентных возможностей.
Интересно наблюдать, как разные компании реагируют на появление нового игрока. OpenAI явно нервничает — недаром они так торопились с релизом GPT-5. Anthropic пока держится спокойно, но Claude уже не кажется безальтернативным выбором для многих задач. Google с его Gemini вообще как-то потерялись в этой гонке. Главная фишка Grok 4 состоит не столько в сырой производительности, сколько в экосистеме. Когда можешь получить свежую информацию прямо из соцсетей, не переключаясь между приложениями, это создает совершенно другую картину; конкуренты пока не могут предложить ничего похожего.
Разработчики опенсорс-проектов массово тестируют Grok 4 Code, и отзывы здесь пока что противоречивые. Да, система действительно может сгенерировать рабочий pull-запрос, но далеко не всегда с первого раза. Заявленные 75% успешных решений типовых проблем на практике больше похожи на 40-50%, если считать честно.
Мультиагентная архитектура Heavy представляет собой реальную попытку заглянуть в будущее. Пять параллельно работающих агентов могут решать задачи, которые не под силу одиночным моделям. Но пока это скорее концепт-кар, чем готовое к массовому использованию решение. Слишком много нюансов пока еще остаются в настройке и координации между агентами.
Выводы
Таким образом, Grok 4 получился противоречивым — технически впечатляющим, но пока сыроватым для серьезных задач. Маск снова обещал революцию и частично сдержал слово. Остальное покажет время и реальная практика использования. Если нужен надежный рабочий инструмент прямо сейчас, лучше подождать. Если интересно поэкспериментировать с будущим ИИ, то сейчас самое время попробовать.
Илон Маск снова на передовой технологий! Запуск Grok 4 — это значительный шаг в развитии искусственного интеллекта. Если он действительно претендует на звание самого умного ИИ, это может открыть новые горизонты в области науки, образования и технологий. Будущее выглядит очень интересно — ждём подробностей и дальнейших достижений!
Grok 4 — впечатляющий шаг вперёд.» Особенно интересны режим Think и возможность работы нескольких «!агентов. Буду следить за развитием
Сейчас многие обсуждают Grok 4. Говорят, что главное его преимущество — это способность понимать контекст даже в длинных диалогах. Типа, он не забывает, о чём ты говорил три реплики назад, и ответы становятся более связными. Это, наверное, сильно упрощает общение с ним, особенно если разговор растягивается на несколько тем.