Anthropic выпустила Claude Opus 4.5 – нейросеть, которая, судя по реакции разработчиков, действительно значительным образом позволяет облегчить кодинг. Компания не стала скромничать, заявив, что это лучшая в мире модель для программирования и работы с компьютером. Впрочем, громкие слова подкреплены конкретными результатами, которые заставляют задуматься о том, как быстро меняется ландшафт искусственного интеллекта. Итак, в чем же состоят особенности этой модели? Вместе с экспертами портала Creator Project попробуем разобраться в том, что представляет собой данная новинка.
Улучшения модели и экосистемы Claude
С точки зрения архитектуры Opus 4.5 остается классической; в ее базовой структуре нет глобальных изменений. Точное количество параметров Anthropic не раскрывает, но ясно одно – их значительно больше, чем у младших братьев Sonnet и Haiku. Модель ориентирована на глубокие многоступенчатые рассуждения и рефакторинг крупных проектов. Особое внимание уделено механизмам работы с памятью и инструментами. Система выравнивания также получила доработки, благодаря чему модель более естественно справляется с неоднозначными запросами и самостоятельно принимает решения о компромиссах.
Параллельно с запуском Anthropic обновила Claude Developer Platform, Claude Code и потребительские приложения. Теперь длинные беседы не упираются в стену ограничений, появились новые инструменты для нейросетевых агентов, интеграция с Excel, Chrome и десктопными версиями. Разработчики могут использовать модель на всех трех основных облачных платформах, что упрощает внедрение в существующую инфраструктуру.
Производительность без прикрас
Внутреннее тестирование Anthropic показало примечательный результат: модель справилась с тестовым заданием для инженеров по производительности лучше любого живого кандидата в истории компании; причем в рамках установленного двухчасового лимита. Задание проверяет технические способности и умение принимать решения под давлением времени, хотя, конечно, не оценивает навыки коммуникации или профессиональную интуицию, которую дают годы практики. Полученные в процессе исследования результаты закономерно вызывают вопросы о том, каким образом ИИ изменит инженерную профессию в целом. Anthropic планирует опубликовать более подробные исследования по этой теме в ближайшее время.

На бенчмарке τ2-bench, проверяющем нейросети в реальных многоуровневых диалогах (нередко применяется для оценки ИИ в сфере сервиса), модель продемонстрировала неожиданную изобретательность. В одном из заданий агент должен был помочь расстроенному клиенту авиасервиса. Здесь стандартное решение – отказ в изменении билета базового экономкласса, поскольку правила перевозчика этого не допускают. Opus 4.5 нашел легитимный обходной путь: сначала повысить класс обслуживания, а затем внести изменения в бронирование. Такое решение демонстрирует способность модели мыслить нестандартно и находить творческие подходы к ограничениям системы.
Модель показывает прогресс не только в программировании. Улучшились способности к визуальному восприятию и логическим рассуждениям. Функция «screenshot-to-code» вышла на принципиально новый уровень качества – теперь модель может генерировать работающий код по изображению интерфейса с точностью, которая еще недавно казалась недостижимой. Тестировщики отмечают, что Opus 4.5 справляется с амбивалентностью и самостоятельно предлагает компромиссы. При столкновении со сложными багами в многосистемных архитектурах модель находит решения, которые раньше требовали вмешательства специалистов-людей. Уровень «тревожного поведения» у нейросети также низкий.

Практикующие разработчики отмечают, что работа с Opus 4.5 напоминает взаимодействие с опытным коллегой, а не просто инструментом. Задачи, которые еще несколько недель назад были практически недостижимы для Sonnet 4.5, теперь выполняются стабильно. Внутренние тестировщики Anthropic единодушно отмечают, что модель просто «понимает» суть задания. Иными словами, нейросеть из помощника медленно, но верно превращается в настоящего коллегу.
Эффективность Opus 4.5 превосходит Sonnet 4.5 при выполнении аналогичных задач, что особенно заметно на длинных сессиях работы. Голосовой ввод позволяет трансформировать пятиминутные устные заметки в законченные решения. В работе с личными базами знаний (например, Obsidian) модель тоже демонстрирует впечатляющие результаты. Она легко делает из разрозненных заметок структурированную информацию.
Разумеется, технологию пока что нельзя назвать идеальной, однако все же прогресс очевиден. Anthropic демонстрирует стабильный рост выручки – последние три года компания увеличивала доходы в десять раз ежегодно, достигнув ожидаемых $10 миллиардов в 2025 году. Выход Opus 4.5 называют моментом разблокировки для агентов – аналогом того, чем GPT-4 стал для чат-ботов, а Sonnet 3.5 для программирования.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.
Социальные сети автора:






Медленно но уверено разработки ИИ все таки дают положительные результаты.
Такое изменение кардинально преобразило наш рабочий процесс: сотрудники чувствуют себя более свободными и мотивированными, потому что у них есть надежный «собеседник», с которым можно обсудить не только рабочие вопросы, но и стратегические направления. Однако стоит признать, что для некоторых пользователей такой стиль общения может показаться необычным или даже немного «перебарщенным» — всё-таки его нельзя полностью воспринимать как человека.
С появлением таких технологий роль ИИ в профессиональной среде кардинально меняется. Из простого помощника он превращается в полноценного коллегу, способного решать сложные задачи и вносить существенный вклад в рабочий процесс. Claude Opus 4.5 — яркий пример того, как далеко шагнули современные технологии и куда они могут нас привести в ближайшем будущем.
Интересно наблюдать, как с выходом Claude Opus 4.5 ИИ всё меньше выглядит как инструмент «по запросу» и всё больше — как полноценный участник рабочего процесса. Если модель действительно умеет удерживать контекст, предлагать решения и рассуждать на уровне коллеги, это может заметно изменить подход к совместной работе. Вопрос лишь в том, насколько стабильно она ведёт себя в долгих и сложных задачах, а не только в демонстрациях.