Claude Opus 4.5. ИИ, который перестал быть помощником и стал коллегой

14.12.202506.03.2026

Anthropic выпустила Claude Opus 4.5 – нейросеть, которая, судя по реакции разработчиков, действительно значительным образом позволяет облегчить кодинг. Компания не стала скромничать, заявив, что это лучшая в мире модель для программирования и работы с компьютером. Впрочем, громкие слова подкреплены конкретными результатами, которые заставляют задуматься о том, как быстро меняется ландшафт искусственного интеллекта. Итак, в чем же состоят особенности этой модели? Вместе с экспертами портала Creator Project попробуем разобраться в том, что представляет собой данная новинка.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео Дзен RuTube ОК

Улучшения модели и экосистемы Claude

С точки зрения архитектуры Opus 4.5 остается классической; в ее базовой структуре нет глобальных изменений. Точное количество параметров Anthropic не раскрывает, но ясно одно – их значительно больше, чем у младших братьев Sonnet и Haiku. Модель ориентирована на глубокие многоступенчатые рассуждения и рефакторинг крупных проектов. Особое внимание уделено механизмам работы с памятью и инструментами. Система выравнивания также получила доработки, благодаря чему модель более естественно справляется с неоднозначными запросами и самостоятельно принимает решения о компромиссах.

Параллельно с запуском Anthropic обновила Claude Developer Platform, Claude Code и потребительские приложения. Теперь длинные беседы не упираются в стену ограничений, появились новые инструменты для нейросетевых агентов, интеграция с Excel, Chrome и десктопными версиями. Разработчики могут использовать модель на всех трех основных облачных платформах, что упрощает внедрение в существующую инфраструктуру.

Производительность без прикрас

Внутреннее тестирование Anthropic показало примечательный результат: модель справилась с тестовым заданием для инженеров по производительности лучше любого живого кандидата в истории компании; причем в рамках установленного двухчасового лимита. Задание проверяет технические способности и умение принимать решения под давлением времени, хотя, конечно, не оценивает навыки коммуникации или профессиональную интуицию, которую дают годы практики. Полученные в процессе исследования результаты закономерно вызывают вопросы о том, каким образом ИИ изменит инженерную профессию в целом. Anthropic планирует опубликовать более подробные исследования по этой теме в ближайшее время.

Точность моделей на SWE-bench Verified: Opus 4.5 лидирует среди других моделей — Точность моделей на SWE-bench Verified: Opus 4.5 лидирует среди других моделей. Изображение: https://www.anthropic.com/news/claude-opus-4-5

На бенчмарке τ2-bench, проверяющем нейросети в реальных многоуровневых диалогах (нередко применяется для оценки ИИ в сфере сервиса), модель продемонстрировала неожиданную изобретательность. В одном из заданий агент должен был помочь расстроенному клиенту авиасервиса. Здесь стандартное решение – отказ в изменении билета базового экономкласса, поскольку правила перевозчика этого не допускают. Opus 4.5 нашел легитимный обходной путь: сначала повысить класс обслуживания, а затем внести изменения в бронирование. Такое решение демонстрирует способность модели мыслить нестандартно и находить творческие подходы к ограничениям системы.

Модель показывает прогресс не только в программировании. Улучшились способности к визуальному восприятию и логическим рассуждениям. Функция «screenshot-to-code» вышла на принципиально новый уровень качества – теперь модель может генерировать работающий код по изображению интерфейса с точностью, которая еще недавно казалась недостижимой. Тестировщики отмечают, что Opus 4.5 справляется с амбивалентностью и самостоятельно предлагает компромиссы. При столкновении со сложными багами в многосистемных архитектурах модель находит решения, которые раньше требовали вмешательства специалистов-людей. Уровень «тревожного поведения» у нейросети также низкий.

Opus 4.5 показывает самые низкие риски среди моделей, подтверждая улучшенное выравнивание и устойчивость к атакам

Агенты выходят из тени

Практикующие разработчики отмечают, что работа с Opus 4.5 напоминает взаимодействие с опытным коллегой, а не просто инструментом. Задачи, которые еще несколько недель назад были практически недостижимы для Sonnet 4.5, теперь выполняются стабильно. Внутренние тестировщики Anthropic единодушно отмечают, что модель просто «понимает» суть задания. Иными словами, нейросеть из помощника медленно, но верно превращается в настоящего коллегу.

Эффективность Opus 4.5 превосходит Sonnet 4.5 при выполнении аналогичных задач, что особенно заметно на длинных сессиях работы. Голосовой ввод позволяет трансформировать пятиминутные устные заметки в законченные решения. В работе с личными базами знаний (например, Obsidian) модель тоже демонстрирует впечатляющие результаты. Она легко делает из разрозненных заметок структурированную информацию.

Разумеется, технологию пока что нельзя назвать идеальной, однако все же прогресс очевиден. Anthropic демонстрирует стабильный рост выручки – последние три года компания увеличивала доходы в десять раз ежегодно, достигнув ожидаемых $10 миллиардов в 2025 году. Выход Opus 4.5 называют моментом разблокировки для агентов – аналогом того, чем GPT-4 стал для чат-ботов, а Sonnet 3.5 для программирования.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

5 комментариев к “Claude Opus 4.5. ИИ, который перестал быть помощником и стал коллегой”

Азат:

14.12.2025 в 10:38

Медленно но уверено разработки ИИ все таки дают положительные результаты.
Надежда:

14.12.2025 в 10:56

Такое изменение кардинально преобразило наш рабочий процесс: сотрудники чувствуют себя более свободными и мотивированными, потому что у них есть надежный «собеседник», с которым можно обсудить не только рабочие вопросы, но и стратегические направления. Однако стоит признать, что для некоторых пользователей такой стиль общения может показаться необычным или даже немного «перебарщенным» — всё-таки его нельзя полностью воспринимать как человека.
Андрей:

14.12.2025 в 12:40

С появлением таких технологий роль ИИ в профессиональной среде кардинально меняется. Из простого помощника он превращается в полноценного коллегу, способного решать сложные задачи и вносить существенный вклад в рабочий процесс. Claude Opus 4.5 — яркий пример того, как далеко шагнули современные технологии и куда они могут нас привести в ближайшем будущем.
pipip vovka:

15.12.2025 в 13:37

Интересно наблюдать, как с выходом Claude Opus 4.5 ИИ всё меньше выглядит как инструмент «по запросу» и всё больше — как полноценный участник рабочего процесса. Если модель действительно умеет удерживать контекст, предлагать решения и рассуждать на уровне коллеги, это может заметно изменить подход к совместной работе. Вопрос лишь в том, насколько стабильно она ведёт себя в долгих и сложных задачах, а не только в демонстрациях.
Екатерина:

30.12.2025 в 07:38

Превосходные результаты внутреннего тестирования, успешные демонстрации — это замечательно. Но, при всех объявленных улучшениях модели, означает ли это что Claude Opus 4.5 от Anthropic полностью избавлена от «галлюцинаций» и её советам можно спокойно доверять. Одно дело помощник, чью работу обычно проверяешь на разных уровнях. Другое дело коллега, которому доверяешь, который делает как и ты свою часть работы и полностью за нее отвечает.

Обсуждение закрыто.

Рекомендуем почитать

Белый Xbox Series X

Xbox в этом году выпустит ИИ‑помощника Gaming Copilot на консолях текущего поколения

Xbox, согласно сообщению GamesRadar, в этом году готовится запустить своего ИИ-помощника Gaming Copilot на «консолях текущего поколения». Сонали Ядав, менеджер…

Женщина проходит мимо гигантского экрана с логотипом на мероприятии в парижской лаборатории Google Lab в рамках саммита AI Action Summit в Париже, 9 февраля 2025 года

Google Maps делает ставку на Gemini: новые ИИ‑функции для поиска мест и навигации

Google Maps будет в большей степени полагаться на искусственный интеллект, помогая людям определяться с тем, куда они хотят поехать, и…

Логотип YouTube

YouTube расширяет технологию выявления дипфейков: доступ получат политики, чиновники и журналисты

YouTube расширяет свою технологию распознавания внешности, которая выявляет созданные ИИ дипфейки, на пилотную группу чиновников, политических кандидатов и журналистов, сообщила…

Обзор Kimi K2.5

«Рой агентов» для решения пользовательских задач. Обзор Kimi K2.5

Китайская компания Moonshot AI выпустила Kimi K2.5 в феврале 2026 года, и главная особенность этой модели звучит почти фантастически. Дело…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности