ИИ-агенты, спорящие друг с другом, а также прочие фишки Grok 4.20

Большинство современных AI-компаний стремятся сделать свои модели умнее, скармливая им больше данных и увеличивая вычислительные мощности. xAI, однако, решила выделиться в этом отношении. Она пошла другим путем: заставила четыре модели постоянно друг с другом спорить. Не так давно компания Илона Маска запустила публичную бету Grok 4.20, и это не обычное обновление с улучшенными метриками. Тут речь идет об архитектуре, в рамках которой четыре специализированных AI-агента работают параллельно и оспаривают выводы друг друга. А ответ выдают только после достижения консенсуса. Вместе с командой Креатор Проджект разберемся, что стоит за новой моделью от xAI.

Смотрите видео на удобном для вас ресурсе!

Четыре агента внутри одной модели

Знакомьтесь: их зовут Grok, Harper, Benjamin и Lucas. У каждого своя личность и функция:

  • Harper – исследователь. Он запускает веб-поиск, подключается к потоку X, в котором проходит примерно 68 миллионов англоязычных твитов ежедневно. Потом агент собирает доказательства и проверяет утверждения. Когда пользователь спрашивает о событии, случившемся час назад, именно Harper молниеносно находит информацию.
  • Benjamin отвечает за математику, код, логику, пошаговые рассуждения. Если Harper предоставляет данные, Benjamin проверяет, выдерживают ли цифры проверку на прочность. Он генерирует код, тестирует алгоритмы, выявляет логические ошибки.
  • Lucas – диссидент системы. Его буквально натренировали не соглашаться с остальными. Пока три других агента формируют консенсус, Lucas ищет дыры в аргументации, оспаривает предпосылки, предлагает альтернативные интерпретации. Это встроенный адвокат дьявола, чья работа заключается в том, чтобы предотвращать групповое мышление внутри AI.
  • Grok играет роль координатора. Когда приходит запрос, он анализирует вопрос, разбивает на подзадачи, активирует остальных трех агентов и синтезирует их выводы в финальный ответ. Это проект-менеджер, который не делает работу сам, но следит за тем, чтобы она была сделана правильно.

Кстати, название версии 4.20 – это классический троллинг Маска, отсылка к интернет-культуре. Но за мемным номером стоит серьезная инженерия.

Пример работы модели

Такая архитектура снижает галлюцинации на 65 %. Когда модель не может выдать уверенно неправильный ответ без внутреннего сопротивления со стороны Lucas, процент фактических ошибок радикальным образом снижается.

Еще один запрос в адрес Grok 4.20

Актуальные цены указаны ниже:

Архитектура ускоренного обучения

Grok 4.20 первым среди моделей линейки получил архитектуру быстрого обучения. Предыдущие версии были статичными после развертывания; то есть, чему обучили, то и работает до следующего крупного релиза. Новая версия непрерывно обновляет свои возможности еженедельно на основе фактического использования. Модель, которую пользователь запускает сегодня, будет заметно умнее той, что была месяц назад, без каких-либо ручных обновлений со стороны клиента.

3 марта вышла Beta 2 с пятью конкретными улучшениями:

  • Она усиленно следует инструкциям и точнее придерживается того, о чем ее действительно спрашивают.
  • Количество галлюцинаций снижено: уверенно неправильных ответов стало меньше.
  • Также в Beta 2 было повышено качество научных текстов с нативной поддержкой LaTeX для математических формул.
  • Модель более точно определяет, когда нужно подтягивать визуальные материалы, а когда нет.
  • И, наконец, была повышена надежность при рендеринге нескольких изображений одновременно.

Кастомные агенты и доступ

Также была анонсирована функция пользовательских AI-агентов. Теперь можно настроить до четырех отдельных агентов, каждого со своей личностью и областью фокуса. Лимит символов для кастомных инструкций сократили с 12000 до 4000; это намеренное решение, чтобы определения агентов оставались более четкими, а не размытыми многословными описаниями.

Grok 4.20 доступен на iOS, Android, а также в веб-версии. Модель не выбирается автоматически. Нужно вручную переключиться на «Grok 4.2» в меню приложения или на X. Доступ требует подписки SuperGrok ($ 30 в месяц) или плана X Premium+.

Маск подтвердил, что Beta 3 уже в разработке. Обещается «множество исправлений и функциональных улучшений». График релиза не назван, но заявление указывает на быстрый итеративный цикл. Компания активно собирает фидбек и оперативно устраняет текущие ограничения. Какой будет новая модель, покажет время.

Выводы

Grok 4.20 демонстрирует не столько рост «интеллекта» модели в классическом понимании, сколько изменение самого подхода к его достижению. Внедрение системы внутренних агентов с конфликтующими ролями стало попыткой приблизить работу нейросети к реальному аналитическому процессу, в котором важна не скорость ответа, а его проверяемость и устойчивость к ошибкам.

При этом остаются открытые вопросы, связанные с прозрачностью таких архитектур и их поведением в нестандартных сценариях. Насколько эффективно внутренний «диссидент» действительно снижает ошибки, а не усложняет вывод, покажет только длительная практика использования.

Пока что Grok 4.20 похож на эксперимент, который может повлиять на дальнейшее развитие AI: от одиночных моделей индустрия постепенно переходит к мультиагентным системам, в работе которых истина рождается не из одного ответа, а из их столкновения.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рекомендуем почитать

Логотип DoorDash Новости

DoorDash представила новые инструменты на базе ИИ для продавцов: ускоренный онбординг, улучшение фото и создание сайтов

06.05.2026 7
DoorDash добавила новые инструменты на базе ИИ, которые позволяют продавцам ускорить подключение к платформе, редактировать фотографии, чтобы блюда выглядели лучше,…

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять
Политика конфиденциальности