GLM-5. Модель, которая работает, а не просто отвечает

06.06.202603.06.2026

Источник: https://blog.siray.ai/glm-5/

Иногда развитие технологий напоминает историю про незадачливого менеджера, который однажды решил, что «и так работает нормально», и пропустил тот момент, когда весь окружающий мир плавно переключился на новый уровень. С языковыми моделями происходит нечто похожее: пока одни обсуждают, умеет ли модель шутить или писать письма, другие уже строят на их базе сложные системы, в которых вес имеют не слова, а действия и результат. Такова модель GLM-5, ставшая надежным инструментом, работающим на дистанции, а не на коротком забеге.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео RuTube ОК

Модель, которая перестала быть просто «умной»

Если смотреть на сухие цифры, разница между поколениями выглядит как очередное «стало больше». Но за этим «больше» скрывается достаточно весомый сдвиг в подходе. Архитектура GLM-5 выросла почти вдвое по общему числу параметров – с 355 до 744 миллиардов, при этом активная часть увеличилась гораздо скромнее. Тут речь идет не о гонке за цифрами ради заголовков, а о попытке перераспределить вычисления так, чтобы модель тратила ресурсы там, где это действительно нужно.

С обучающими данными похожая история. Объем корпуса увеличился до 28,5 триллионов токенов, но важнее не сам масштаб, а разнообразие сигналов, на которых модель учится принимать решения. В результате модель выглядит менее «реактивной» и чуть более осмысленной в выполнении длинных задач, состоящих из цепочек действий.

Но на одном предобучении история не заканчивается. Существенную роль играет этап дообучения, в котором используется асинхронная инфраструктура обучения с подкреплением. Благодаря такому подходу разработчики получили возможность ускорить итерации и чаще корректировать поведение модели без необходимости в затяжных циклах обучения. Удержание логики процесса в течение длительного времени стало возможным в том числе и за счет оптимизации.

Интересный момент связан с вниманием (в прямом и техническом смысле). Экономика работы модели изменилась: в случае GLM-5 длинный контекст больше не роскошь, за которую приходится платить слишком высокую цену. Это тот случай, когда новые инженерные решения сказываются именно на практическом применении модели, и в особенности в тех случаях, когда выполнение задачи не укладывается в пару экранов текста.

Сравнение GLM-5 с другими моделями на ключевых бенчмарках. Источник: https://blog.siray.ai/glm-5/

От диалога к полноценной работе

Есть ощущение, что индустрия постепенно устала от формата «задай вопрос и получи ответ». GLM-5 явно движется в сторону другой парадигмы: модель должна не просто говорить, а доводить задачу до закономерного результата. И это заметно даже в том, как она обращается с документами. Модель способна взять текстовое описание и превратить его в готовый файл (к примеру, отчет или таблицу). Не черновик, а именно законченный артефакт, который можно открыть и использовать. В этом месте модель начинает напоминать не собеседника, а младшего коллегу, которому можно делегировать кусок работы. Конечно, с оговоркой, что проверка все еще остается на человеке.

Отдельный акцент сделан на агентных сценариях. Модель рассчитана на длинные цепочки действий, в которых нейросети нужно не только выполнить шаг, но и помнить, зачем он вообще был нужен. Поэтому модель будет в особенности эффективной в разработке и системном проектировании, ведь здесь ошибка на раннем этапе может «аукнуться» через десятки шагов.

При выполнении теста Artificial Analysis Intelligence Index GLM-5 использует меньше выходных токенов, чем GLM-4.7. Источник: https://artificialanalysis.ai/articles/glm-5-everything-you-need-to-know

Длинная дистанция и странный тест с автоматом

Чтобы понять, насколько модель умеет мыслить на горизонте, разработчики используют довольно любопытные бенчмарки. Один из них моделирует работу вендингового бизнеса на протяжении года. На первый взгляд, похоже на игру, но на деле это проверка способности планировать и не терять нить происходящего. GLM-5 здесь показала результат, который приближается к более дорогим и закрытым решениям. То есть, модель не просто принимает локальные решения, а пытается удерживать курс.

Похожая картина наблюдается и в других тестах: заметный рост эффективности в решении задач, связанных с программированием и комплексными системами. Разрыв с предыдущими версиями сокращается не за счет одного «вау-эффекта», а за счет множества мелких улучшений, которые в сумме дают более стабильное поведение.

Интересно, что за всем этим стоит не только масштаб, но и изменения в обучении после предтренировки. Усиленное обучение традиционно считается узким местом – дорого, долго и не всегда предсказуемо. Здесь используется асинхронная инфраструктура, которая ускоряет процесс и позволяет чаще «подкручивать» модель. В результате она становится менее застывшей и чуть более адаптивной.

Заключение

Эксперты Креатор Проджект подчеркивают: модель GLM-5 выглядит аккуратным, однако уверенным шагом в сторону моделей, умеющих в действительности работать, а не просто автоматически предоставлять ответы. Это нейросеть без лишнего пафоса, с понятными компромиссами, хотя и со все еще заметными ограничениями.

И, пожалуй, в этом есть определенная честность: вместо попытки казаться универсальным интеллектом модель постепенно осваивает роль инструмента, который полезен не в каждом разговоре, но вполне уместен там, где задача не заканчивается на первом ответе.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

6 комментариев к “GLM-5. Модель, которая работает, а не просто отвечает”

Саша:

06.06.2026 в 15:50

Если смотреть на рынок ИИ в целом, то сегодня конкуренция всё больше смещается от вопроса «кто лучше отвечает?» к вопросу «кто лучше выполняет задачи?». Именно в этом направлении и развивается GLM-5.
Вадим:

06.06.2026 в 19:23

Хорошо, что проверка готовой работы всё ещё требует проверки человеком. Это значит, что составление грамотных, живых текстов пока невозможно поставить на массовый поток, и лишить людей работы в этой сфере полностью.
Андрей Седов:

07.06.2026 в 13:09

Я протестировал демо версию GLM 5 на нескольких задачах: Автоматизация техподдержки: модель обрабатывала типовые запросы, генерировала ответы, проверяла их на соответствие базе знаний. Результат: снижение нагрузки на операторов на 30% без потери качества. Анализ клиентских отзывов: GLM 5 выделила ключевые темы, оценила тональность, сформировала отчёт с рекомендациями. По сравнению с предыдущими моделями, точность выросла на 15%. Генерация кода: написала простые скрипты на Python, оформила документацию что вполне приемлемо для рутинных задач.
pipip vovka:

08.06.2026 в 12:45

Интересно наблюдать, как новые ИИ-модели постепенно уходят от формата “чат-бота” к полноценным рабочим инструментам. Если GLM-5 действительно умеет не только генерировать текст, но и выполнять сложные задачи с контекстом и логикой, то это уже совсем другой уровень применения ИИ в реальной работе 🚀
Саша:

08.06.2026 в 15:02

Если рассматривать её как позиционирование, то основной посыл такой: ценность ИИ определяется не качеством диалога, а способностью доводить задачи до результата.
Екатерина:

15.06.2026 в 13:02

Отличные новости, теперь ИИ-модель GLM-5 может быть не только «кукушкой» по запросу «а сколько еще лет…», а полноценным, пусть и младшим, сотрудником, помощником. Может выполнять даже часть моей работы! Понятно, что функции контроля с человека не снимаются. Но это ведь и в реальной жизни с реальными сотрудниками так: доверяй, но проверяй.

Обсуждение закрыто.

Рекомендуем почитать

DeepSeek

Почему все снова говорят о китайской модели DeepSeek? Чем удивила новая модель V4

Полтора года назад китайская компания DeepSeek выпустила модель R1, и за один день акции Nvidia потеряли почти 600 миллиардов долларов…

Xiaomi OmniVoice

OmniVoice от Xiaomi. Как работает ИИ, способный говорить на сотнях языков

Несколько секунд чьего-то голоса, и нейросеть от Xiaomi уже готова заговорить этим голосом хоть на суахили, хоть на узбекском. Да…

Claude

Alibaba запретит своим сотрудникам использовать ИИ-инструмент Claude Code

Согласно многочисленным сообщениям, китайская компания Alibaba запретит своим сотрудникам использовать Claude Code от Anthropic, начиная с 10 июля. Anthropic уже…

GLM-5.1

Китайская нейросеть GLM-5.1 неожиданно вышла в лидеры по программированию

События, которые заставляют пересмотреть привычную расстановку сил, в сфере ИИ происходят не так часто. Однако некоторые релизы все же претендуют…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности