ИИ-агенты, спорящие друг с другом, а также прочие фишки Grok 4.20

10.05.202608.05.2026

Источник изображения: https://www.nextgov.com/acquisition/2025/09/gsa-inks-onegov-deal-grok-ai/408334/

Большинство современных AI-компаний стремятся сделать свои модели умнее, скармливая им больше данных и увеличивая вычислительные мощности. xAI, однако, решила выделиться в этом отношении. Она пошла другим путем: заставила четыре модели постоянно друг с другом спорить. Не так давно компания Илона Маска запустила публичную бету Grok 4.20, и это не обычное обновление с улучшенными метриками. Тут речь идет об архитектуре, в рамках которой четыре специализированных AI-агента работают параллельно и оспаривают выводы друг друга. А ответ выдают только после достижения консенсуса. Вместе с командой Креатор Проджект разберемся, что стоит за новой моделью от xAI.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео RuTube ОК

Четыре агента внутри одной модели

Знакомьтесь: их зовут Grok, Harper, Benjamin и Lucas. У каждого своя личность и функция:

Harper – исследователь. Он запускает веб-поиск, подключается к потоку X, в котором проходит примерно 68 миллионов англоязычных твитов ежедневно. Потом агент собирает доказательства и проверяет утверждения. Когда пользователь спрашивает о событии, случившемся час назад, именно Harper молниеносно находит информацию.
Benjamin отвечает за математику, код, логику, пошаговые рассуждения. Если Harper предоставляет данные, Benjamin проверяет, выдерживают ли цифры проверку на прочность. Он генерирует код, тестирует алгоритмы, выявляет логические ошибки.
Lucas – диссидент системы. Его буквально натренировали не соглашаться с остальными. Пока три других агента формируют консенсус, Lucas ищет дыры в аргументации, оспаривает предпосылки, предлагает альтернативные интерпретации. Это встроенный адвокат дьявола, чья работа заключается в том, чтобы предотвращать групповое мышление внутри AI.
Grok играет роль координатора. Когда приходит запрос, он анализирует вопрос, разбивает на подзадачи, активирует остальных трех агентов и синтезирует их выводы в финальный ответ. Это проект-менеджер, который не делает работу сам, но следит за тем, чтобы она была сделана правильно.

Кстати, название версии 4.20 – это классический троллинг Маска, отсылка к интернет-культуре. Но за мемным номером стоит серьезная инженерия.

Пример работы модели

Такая архитектура снижает галлюцинации на 65 %. Когда модель не может выдать уверенно неправильный ответ без внутреннего сопротивления со стороны Lucas, процент фактических ошибок радикальным образом снижается.

Еще один запрос в адрес Grok 4.20

Актуальные цены указаны ниже:

Архитектура ускоренного обучения

Grok 4.20 первым среди моделей линейки получил архитектуру быстрого обучения. Предыдущие версии были статичными после развертывания; то есть, чему обучили, то и работает до следующего крупного релиза. Новая версия непрерывно обновляет свои возможности еженедельно на основе фактического использования. Модель, которую пользователь запускает сегодня, будет заметно умнее той, что была месяц назад, без каких-либо ручных обновлений со стороны клиента.

3 марта вышла Beta 2 с пятью конкретными улучшениями:

Она усиленно следует инструкциям и точнее придерживается того, о чем ее действительно спрашивают.
Количество галлюцинаций снижено: уверенно неправильных ответов стало меньше.
Также в Beta 2 было повышено качество научных текстов с нативной поддержкой LaTeX для математических формул.
Модель более точно определяет, когда нужно подтягивать визуальные материалы, а когда нет.
И, наконец, была повышена надежность при рендеринге нескольких изображений одновременно.

Кастомные агенты и доступ

Также была анонсирована функция пользовательских AI-агентов. Теперь можно настроить до четырех отдельных агентов, каждого со своей личностью и областью фокуса. Лимит символов для кастомных инструкций сократили с 12000 до 4000; это намеренное решение, чтобы определения агентов оставались более четкими, а не размытыми многословными описаниями.

Grok 4.20 доступен на iOS, Android, а также в веб-версии. Модель не выбирается автоматически. Нужно вручную переключиться на «Grok 4.2» в меню приложения или на X. Доступ требует подписки SuperGrok ($ 30 в месяц) или плана X Premium+.

Маск подтвердил, что Beta 3 уже в разработке. Обещается «множество исправлений и функциональных улучшений». График релиза не назван, но заявление указывает на быстрый итеративный цикл. Компания активно собирает фидбек и оперативно устраняет текущие ограничения. Какой будет новая модель, покажет время.

Выводы

Grok 4.20 демонстрирует не столько рост «интеллекта» модели в классическом понимании, сколько изменение самого подхода к его достижению. Внедрение системы внутренних агентов с конфликтующими ролями стало попыткой приблизить работу нейросети к реальному аналитическому процессу, в котором важна не скорость ответа, а его проверяемость и устойчивость к ошибкам.

При этом остаются открытые вопросы, связанные с прозрачностью таких архитектур и их поведением в нестандартных сценариях. Насколько эффективно внутренний «диссидент» действительно снижает ошибки, а не усложняет вывод, покажет только длительная практика использования.

Пока что Grok 4.20 похож на эксперимент, который может повлиять на дальнейшее развитие AI: от одиночных моделей индустрия постепенно переходит к мультиагентным системам, в работе которых истина рождается не из одного ответа, а из их столкновения.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

5 комментариев к “ИИ-агенты, спорящие друг с другом, а также прочие фишки Grok 4.20”

Саша:

10.05.2026 в 14:22

Самая необычная штука: один агент буквально создан для того, чтобы не соглашаться. Он атакует выводы остальных и пытается найти слабые места. Это уже похоже на peer review внутри ИИ.
Вадим:

10.05.2026 в 20:03

Я, если честно, не особо понял: если каждая модель запрограммирована на оспаривание суждений других моделей, то в случае, когда одна из моделей выдаст абсолютно истинное суждение, с ней всё-равно будут спорить? Если так, не знаю насколько они действительно будут «умнеть».
pipip vovka:

11.05.2026 в 13:37

Хорошая инициатива: ИИ не должен оставлять человека один на один со стрессом.
Если Trusted Contact реально поможет вовремя подключить близких, это шаг к более человечному и ответственному использованию технологий
Андрей Седов:

11.05.2026 в 17:42

Grok 4.20 это шаг вперёд в том, как ИИ взаимодействует с человеком. Идея спорящих агентов это крутая фишка, которая заставляет задуматься и развивает критическое мышление. Однако технология пока сыровата: бывают проколы в логике, иногда агенты ведут себя неестественно. Grok 4.20 это не замена человеку, а инструмент, который расширяет границы мышления. Спорящие агенты не дадут готового ответа, но заставят посмотреть на проблему под разными углами.
Екатерина:

23.05.2026 в 21:46

Практическое подтверждение утверждения: в споре рождается истина. Ну пусть не истина, но что-то уже недалеко от истины и без контроля со стороны человека. Это важно в плане снижения процента «ИИ-галлюцинаций», а значит повышает доверие и надежность систем с ИИ.

Обсуждение закрыто.

Рекомендуем почитать

Дженсен Хуанг, президент и генеральный директор Nvidia, слушает интервью перед церемонией закладки первого камня в строительство расширения производственного предприятия Coherent во вторник, 16 июня 2026 года, в Шермане, штат Техас

Дженсен Хуанг: обществу пора не бояться ИИ, а учиться жить с ним

Глава Nvidia Дженсен Хуанг — один из людей, чья работа ускорила взлёт искусственного интеллекта, — в интервью заявил: обществу пора…

Аудиокассета

MAI-Transcribe-1. Microsoft решила, что больше не хочет зависеть от чужих ушей

Пока весь мир привык считать, что функцией голосового распознавания можно воспользоваться либо при помощи Whisper от OpenAI, либо посредством чего-то…

Mixhalo DeepL

Mixhalo поможет DeepL улучшить перевод выступлений и дискуссий на конференциях

На конференциях докладчики часто выступают или участвуют в панельных дискуссиях на языках, которые многие посетители могут не знать. Из-за этого слушатели спешно…

Брет Джонсен (в центре), финансовый директор SpaceX, и Гвинн Шотвелл (в центре справа), президент и главный операционный директор SpaceX, празднуют открытие торгов на площадке Nasdaq MarketSite в честь начала первичного публичного размещения акций (IPO) SpaceX в Нью-Йорке 12 июня 2026 года

Американцы всё чаще используют ИИ, но не верят в его будущее

Несмотря на то что ИИ всё больше доминирует в экономике — сейчас жаркое лето IPO, а мы все просто плывём по…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности