Китайская нейросеть GLM-5.1 неожиданно вышла в лидеры по программированию

События, которые заставляют пересмотреть привычную расстановку сил, в сфере ИИ происходят не так часто. Однако некоторые релизы все же претендуют на то, чтобы относиться к такого рода категории. Одним из таких недавних событий стал выпуск модели GLM-5.1 от китайской компании Z.ai, ранее известной как Zhipu AI.

Новая модель привлекла внимание, в первую очередь, потому, что показала очень сильные результаты в программировании. Но еще одна причина обсуждений заключается в том, что GLM-5.1 смогла занять первое место в одном из самых сложных и авторитетных тестов для ИИ-разработчиков – SWE-Bench Pro. В этом рейтинге она немного опередила GPT-5.4 от OpenAI и Claude Opus 4.6 от Anthropic.

Для многих специалистов этот факт стал неожиданным. В последние годы лидерами в области программирования считались в основном американские модели, поэтому успех китайской разработки вызвал большой интерес как среди разработчиков, так и среди инвесторов.

Смотрите видео на удобном для вас ресурсе!

Особенности модели GLM-5.1

GLM-5.1 не является полностью новой моделью, созданной с нуля. Она представляет собой улучшенную версию модели GLM-5, которая была представлена несколькими месяцами ранее. Разработчики в этот раз сосредоточились прежде всего на задачах программирования, работе с кодом и выполнении сложных многоэтапных действий. По сути, модель дорабатывали специально для того, чтобы она могла лучше справляться с повседневными задачами разработчиков: искать ошибки в коде, исправлять их, понимать большие проекты и работать с несколькими файлами одновременно.

Архитектура модели относится к типу Mixture of Experts («смесь экспертов»). Так называют подход, при котором во время работы задействуется не вся нейросеть целиком, а только часть специализированных модулей. Благодаря этому методу удается сочетать высокое качество ответов с более эффективным использованием вычислительных ресурсов.

Также модель способна работать с очень большими объемами текста и кода за один запрос. Данная особенность удобна для программистов, которым часто приходится иметь дело с крупными проектами, содержащими десятки и сотни файлов.

Пример работы GLM-5.1

Почему все говорят о тесте SWE-Bench Pro

Когда компании выпускают новые модели, они обычно публикуют результаты различных тестов. Однако далеко не все бенчмарки одинаково полезны.

SWE-Bench Pro считается одним из наиболее сложных тестов для оценки навыков программирования. В данном случае вместо решения абстрактных задач модели получают реальные проблемы из существующих программных проектов. Им нужно понять код, найти ошибку, после чего предложить рабочее исправление. Именно в этом тесте GLM-5.1 показала результат около 58 %, немного опередив GPT-5.4 и Claude Opus 4.6.

Однако при этом стоит понимать, что речь не идет о полном превосходстве над конкурентами. Разница между моделями оказалась небольшой и измеряется буквально несколькими десятыми долями процента. Тем не менее сам факт выхода на первое место привлек огромное внимание, поскольку раньше открытые модели редко могли конкурировать с лучшими коммерческими системами.

Источник: https://z.ai/blog/glm-5.1

Не только успехи, но и ограничения

Несмотря на впечатляющие результаты в программировании, GLM-5.1 нельзя назвать лидером абсолютно во всех областях. К примеру, на тестах, связанных с общими знаниями и сложными рассуждениями, модели OpenAI и Google по-прежнему показывают более сильные результаты. А это еще раз доказывает: GLM-5.1 создавалась прежде всего в качестве инструмента для разработки программного обеспечения, а не в качестве универсального чемпиона во всех категориях.

Сама компания Z.ai не скрывает этот факт и признает, что в некоторых направлениях модели еще есть куда расти. Поэтому, по мнению экспертов Креатор Проджект, наиболее точным описанием будет следующее: GLM-5.1 на сегодняшний день является одной из сильнейших моделей для программирования, но лучшей моделью для любых задач она не является.

Открытая модель вместо закрытого сервиса

Одной из интересных особенностей GLM-5.1 является то, что модель распространяется по лицензии MIT, одной из самых свободных лицензий в мире программного обеспечения. Разработчики могут скачать модель, запускать ее на собственных серверах, изменять под свои задачи и использовать в коммерческих проектах без серьезных ограничений. Такой подход выгодно отличает GLM-5.1 от большинства крупнейших коммерческих моделей, внутреннее устройство которых остается закрытым. Модель можно изучать, тестировать, а также и создавать на ее основе собственные решения.

Релиз GLM-5.1 многие специалисты называют одним из самых заметных событий в индустрии искусственного интеллекта в 2026 году. Модель не изменила рынок за один день, но показала, что борьба за лидерство в сфере ИИ становится все более конкурентной и непредсказуемой.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Один комментарий к “Китайская нейросеть GLM-5.1 неожиданно вышла в лидеры по программированию

  1. Решил потестировать: дал задачу написать REST API на Go с аутентификацией и логированием. Результат: код скомпилировался с первого раза; структура папок как у опытного разработчика; комментарии лаконичные, но информативные; обработка ошибок на уровне. Да, есть мелкие недочёты (например иногда избыточно использует некоторые пакеты), но в целом впечатляет. Шучу, что теперь когда GLM 5.1 в топе можно отвечать на жалобы начальства: Не я не ленивый просто жду пока нейросеть допишет код!😄 А если серьёзно то такие инструменты реально меняют подход к разработке: вместо того чтобы изобретать велосипед можно сосредоточиться на логике продукта.

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рекомендуем почитать

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять
Политика конфиденциальности