...

Anthropic представила Claude Opus 4.5 — самую продвинутую модель в своей линейке

В понедельник компания Anthropic анонсировала Opus 4.5 — новую версию своей флагманской модели. Это последняя модель из серии 4.5, следом за выпуском Sonnet 4.5 в сентябре и Haiku 4.5 в октябре.

Смотрите видео на удобном для вас ресурсе!

Как и ожидалось, новая версия Opus демонстрирует передовые результаты на ряде тестов, включая бенчмарки для программирования (SWE-Bench и Terminal-bench), работы с инструментами (tau2-bench и MCP Atlas), а также решения общих задач (ARC-AGI 2, GPQA Diamond).

Особенно примечательно, что Opus 4.5 стала первой моделью, набравшей более 80% на SWE-Bench verified — авторитетном тесте для программистов.

Anthropic также отдельно подчеркнула способности Opus в работе с компьютерами и электронными таблицами, а также представила ряд сопутствующих продуктов, демонстрирующих эффективность модели в этих сценариях. Одновременно с Opus 4.5 компания сделает продукты Claude для Chrome и Claude для Excel — ранее находившиеся в пилотном режиме — доступными широкой публике. Расширение для Chrome смогут использовать все пользователи тарифа Max, а модель для Excel — пользователи Max, Team и Enterprise.

Opus 4.5 также получила улучшения в работе с памятью при обработке длинных контекстов, что потребовало значительных изменений в управлении памятью модели.

«Мы улучшили качество обработки длинного контекста в обучении Opus 4.5, но одних только больших окон контекста недостаточно», — рассказала Дайан На Пенн, руководитель по управлению продуктами в исследовательском подразделении Anthropic. — «Очень важно не просто иметь длинное окно, но и уметь запоминать по-настоящему важные детали».

Эти изменения также позволили реализовать давно ожидаемую функцию «бесконечного чата» для платных пользователей Claude: теперь диалог продолжится без перерыва, даже если модель достигнет лимита окна контекста — вместо этого контекст будет сжиматься без уведомления пользователя.

Многие из обновлений ориентированы на агентные сценарии использования, в частности — когда Opus выступает в роли главного агента, управляющего группой подагентов на базе Haiku. Такие задачи требуют высокой эффективности рабочей памяти, и именно здесь улучшения, о которых говорила Пенн, проявляют себя особенно ярко.

«В этом и кроется важность фундаментальных вещей, таких как память», — говорит Пенн. — «Claude должен уметь изучать большие кодовые базы и документы, а также понимать, когда нужно вернуться назад и перепроверить что-то».

Opus 4.5 предстоит конкурировать с другими недавно представленными моделями передового уровня, в частности — с GPT 5.1 от OpenAI (выпущен 12 ноября) и Gemini 3 от Google (выпущен 18 ноября).

Источник: TechCrunch

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Один комментарий к “Anthropic представила Claude Opus 4.5 — самую продвинутую модель в своей линейке

  1. Интересно, какие именно качественные скачки произошли в Claude Opus 4.5 по сравнению с предыдущими версиями? Особенно в области креативных задач и многозадачности. И как это повлияет на конкурентную среду — будет ли это догоняющая гонка с GPT-5 или антропик нашла свою уникальную нишу? Жду сравнительных тестов и реальных кейсов применения.

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять