«Рой агентов» для решения пользовательских задач. Обзор Kimi K2.5

11.03.202611.03.2026

Китайская компания Moonshot AI выпустила Kimi K2.5 в феврале 2026 года, и главная особенность этой модели звучит почти фантастически. Дело в том, что она может одновременно запустить до ста AI-помощников, которые работают параллельно над одной задачей. То есть, вы даете системе сложное задание наподобие анализа рынка, и она мгновенно создает команду специалистов. Один собирает данные, другой их проверяет, третий пишет отчет, и все перечисленное происходит одновременно, а не по очереди.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео Дзен RuTube ОК

Agent Swarm: новое решение от Moonshot AI

Результат готов в 4,5 раза быстрее, чем если бы модель делала все сама шаг за шагом. По меньшей мере, именно в этом заверяют юзеров разработчики. Технология называется Agent Swarm, что в переводе означает «рой агентов». Система сама решает, сколько помощников ей нужно, как их организовать и какие инструменты использовать. Никаких ручных настроек или предустановок для этого не требуется.

На практике система работает очень быстро, в том числе и при решении сложных задач. Однако при этом есть одна деталь. Чем больше агентов запущено, тем больше система тратит на обработку запроса. Быстрее получаешь ответ, но платишь за это больше токенов. Все-таки пользователю и в этом случае приходится выбирать между скоростью и стоимостью.

При этом стоит помнить, что подобные системы с «роем агентов» чаще всего представляют собой механизм оркестрации одной модели, которая разбивает задачу на подзадачи и обрабатывает их последовательно или частично параллельно.

В чем модель сильна

В работе с интернетом Kimi K2.5 оставляет конкурентов позади. Тесты показывают, что модель на 17 % лучше GPT-5.2 справляется с поиском информации и навигацией по сайтам. Распознавание текста на изображениях тоже на высоте: K2.5 читает плохие сканы, счета и скриншоты интерфейсов лучше западных аналогов на 11 %.

Модель способна обрабатывать огромные тексты до 256 тысяч слов за раз. Звучит отлично, но в реальности и тут все несколько сложнее. Точность остается высокой только на первых 100 тысячах слов. Дальше качество начинает падать. Одна юридическая фирма попыталась загрузить большой контракт целиком и получила почти двадцать процентов ошибок. Пришлось разбивать документ на части, что свело на нет преимущество длинного контекста. На практике безопасный предел составляет около 150 тысяч слов, а не заявленные 256.

Также, как отмечают пользователи, система понимает изображения и видео так же хорошо, как текст, применяя одинаковую логику к разным типам данных. На внутренних тестах офисной работы K2.5 показала улучшение почти на 60 % по сравнению с предыдущей версией. Moonshot AI выпустила технологию так называемого «роя агентов» в качестве тестовой функции. Разработчики отмечают, что в настоящее время она демонстрирует переход от одиночных помощников к координированным командам ИИ-агентов.

Модель создает документы и таблицы прямо в диалоге. Для нее не составит труда сгенерировать и веб-страницу:

Также пользователь может попросить ИИ создать презентацию; для этого также необходимо выбрать соответствующего агента в меню.

Мы попросили создать презентацию на тему улучшения иммунитета в весеннее время года. Агент сначала разработал структуру документа:

После этого были подобраны изображения и создана сама презентация:

Процесс происходил небыстро, однако при этом за его ходом можно было наблюдать непосредственно в чате.

В чем K2.5 не дотягивает

В математике и написании кода K2.5 хороша, но лучшей ее назвать все же нельзя. На математическом тесте модель решает 96 % задач, что довольно-таки неплохо для открытой системы. Проблема в том, что GPT-5.2 и китайский конкурент Qwen3-Max справляются со всеми задачами без единой ошибки, однако обозреваемая нами модель все же иногда выдает неточности. В кодинге картина похожая: K2.5 лидирует среди открытых моделей, но отстает от топовых закрытых систем почти на 12 %. Для обычных задач разработки ее хватает, однако в сложных случаях глубины понимания зачастую все же не хватает.

Серьезная проблема имеется и с надежностью: модель часто галлюцинирует. Она работает лучше предыдущей версии, но все равно «галлюцинации» случаются довольно часто. K2.5 склонна выдавать неправильные ответы с полной уверенностью, выдумывать ссылки и сопротивляться исправлениям, так что в выполнении важных задач обязательно придется сверять информацию самостоятельно. Один разработчик попросил модель воссоздать простую игру и получил приличный результат, хотя и не идеальный. Для сравнения запустил ту же задачу на другой продвинутой модели, и та вообще провалилась. Иными словами, K2.5 лучше справляется с практическими делами, чем с чистой теорией.

Выводы

Команда Креатор Проджект отмечает, что модель Kimi K2.5 впечатляет скоростью своей работы – особенно в выполнении тех задач, которые связаны с поиском информации в Сети и созданием визуальных данных. Модель обошла GPT-5.2 в практических офисных делах и стала лучшей открытой системой с автономными агентами. Но если нужна абсолютная точность в математике или топовый уровень программирования, закрытые конкуренты наподобие Qwen3 остаются более надежным вариантом. Для решения большинства реальных задач K2.5 предлагает мощность по доступной цене. Система не безупречна, но для открытой модели результат впечатляющий.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

Добавить комментарий Отменить ответ

Рекомендуем почитать

Сэм Альтман

OpenAI приобрела стартап Promptfoo для улучшения безопасности ИИ-агентов

OpenAI в понедельник объявила о приобретении Promptfoo — стартапа в сфере ИИ-безопасности, основанного в 2024 году для защиты LLM от…

Главная страница Claude Sonnet 4.6

Claude Sonnet 4.6. Средняя модель, которая обогнала флагман

Anthropic выпустила Claude Sonnet 4.6 в феврале 2026 года, и это обновление оказалось неожиданно сильным. Модель улучшилась в кодинге, управлении…

Главная страница Z.ai

Бесплатный помощник Z.ai. Делает презентации, пишет код, но без минусов не обошлось

Сервис Z.ai вряд ли можно отнести к самым трендовым нейросетям, однако этот бесплатный чат-бот на базе китайских моделей GLM-4.7, GLM-4.6…

Искусственный интеллект

Anthropic обвинила DeepSeek, MiniMax и Moonshot в незаконной «дистилляции» модели Claude

Anthropic утверждает, что DeepSeek и ещё две китайские AI-компании неправомерно использовали её модель Claude, пытаясь улучшить собственные продукты. В объявлении,…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности