В понедельник компания Anthropic анонсировала Opus 4.5 — новую версию своей флагманской модели. Это последняя модель из серии 4.5, следом за выпуском Sonnet 4.5 в сентябре и Haiku 4.5 в октябре.
Как и ожидалось, новая версия Opus демонстрирует передовые результаты на ряде тестов, включая бенчмарки для программирования (SWE-Bench и Terminal-bench), работы с инструментами (tau2-bench и MCP Atlas), а также решения общих задач (ARC-AGI 2, GPQA Diamond).
Особенно примечательно, что Opus 4.5 стала первой моделью, набравшей более 80% на SWE-Bench verified — авторитетном тесте для программистов.
Anthropic также отдельно подчеркнула способности Opus в работе с компьютерами и электронными таблицами, а также представила ряд сопутствующих продуктов, демонстрирующих эффективность модели в этих сценариях. Одновременно с Opus 4.5 компания сделает продукты Claude для Chrome и Claude для Excel — ранее находившиеся в пилотном режиме — доступными широкой публике. Расширение для Chrome смогут использовать все пользователи тарифа Max, а модель для Excel — пользователи Max, Team и Enterprise.
Opus 4.5 также получила улучшения в работе с памятью при обработке длинных контекстов, что потребовало значительных изменений в управлении памятью модели.
«Мы улучшили качество обработки длинного контекста в обучении Opus 4.5, но одних только больших окон контекста недостаточно», — рассказала Дайан На Пенн, руководитель по управлению продуктами в исследовательском подразделении Anthropic. — «Очень важно не просто иметь длинное окно, но и уметь запоминать по-настоящему важные детали».
Эти изменения также позволили реализовать давно ожидаемую функцию «бесконечного чата» для платных пользователей Claude: теперь диалог продолжится без перерыва, даже если модель достигнет лимита окна контекста — вместо этого контекст будет сжиматься без уведомления пользователя.
Многие из обновлений ориентированы на агентные сценарии использования, в частности — когда Opus выступает в роли главного агента, управляющего группой подагентов на базе Haiku. Такие задачи требуют высокой эффективности рабочей памяти, и именно здесь улучшения, о которых говорила Пенн, проявляют себя особенно ярко.
«В этом и кроется важность фундаментальных вещей, таких как память», — говорит Пенн. — «Claude должен уметь изучать большие кодовые базы и документы, а также понимать, когда нужно вернуться назад и перепроверить что-то».
Opus 4.5 предстоит конкурировать с другими недавно представленными моделями передового уровня, в частности — с GPT 5.1 от OpenAI (выпущен 12 ноября) и Gemini 3 от Google (выпущен 18 ноября).
Источник: TechCrunch
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.
Социальные сети автора:






Интересно, какие именно качественные скачки произошли в Claude Opus 4.5 по сравнению с предыдущими версиями? Особенно в области креативных задач и многозадачности. И как это повлияет на конкурентную среду — будет ли это догоняющая гонка с GPT-5 или антропик нашла свою уникальную нишу? Жду сравнительных тестов и реальных кейсов применения.