В понедельник компания OpenAI объявила о выпуске новой версии GPT-5 для своего ИИ-агента для программирования — Codex. По словам компании, новинка, получившая название GPT-5-Codex, распределяет время на “размышления” более динамично по сравнению с предыдущими версиями: на выполнение одной задачи у неё может уходить от нескольких секунд до семи часов. Благодаря этому она демонстрирует лучшие результаты на тестах агентных кодирующих решений.
Сейчас новая модель поэтапно внедряется в продукты Codex, доступные через терминал, IDE, GitHub или ChatGPT, для всех пользователей ChatGPT Plus, Pro, Business, Edu и Enterprise. OpenAI также планирует в будущем предоставить эту модель клиентам API.
Обновление является частью стратегии OpenAI по повышению конкурентоспособности Codex на фоне других ИИ-решений для программирования, таких как Claude Code, Cursor от Anysphere и GitHub Copilot от Microsoft. В течение последнего года рынок ИИ-инструментов для программирования значительно вырос из-за высокого спроса со стороны пользователей. В начале 2025 года выручка Cursor превысила $500 млн ARR, а Windsurf — аналогичный редактор кода — оказался в центре бурной сделки по приобретению, в ходе которой команда разделилась между Google и Cognition.
По данным OpenAI, GPT-5-Codex превосходит GPT-5 на наборе тестов SWE-bench Verified, оценивающем агентные возможности написания кода, а также на тестах по рефакторингу кода из крупных и хорошо известных репозиториев.
Компания также отмечает, что GPT-5-Codex обучался проводить проверки кода, а опытные инженеры-программисты оценивали комментарии модели к ревью. По результатам проверки инженеры отметили, что GPT-5-Codex делает меньше некорректных замечаний и чаще добавляет комментарии с высоким вкладом.
На брифинге руководитель продукта Codex Александр Эмбирикос отметил, что значительная часть улучшения производительности связана с динамическими “мысленными способностями” GPT-5-Codex. Пользователи уже могли познакомиться с роутером GPT-5 в ChatGPT, который распределяет запросы между различными моделями в зависимости от сложности задачи. Эмбирикос пояснил, что GPT-5-Codex работает сходным образом, но при этом не использует роутер, а самостоятельно регулирует время выполнения задачи в режиме реального времени.
По словам Эмбирикоса, это дает преимущество по сравнению с роутером, который заранее определяет требуемые ресурсы и время на задачу. GPT-5-Codex же может, например, через пять минут понять, что задаче потребуется еще час работы. Эмбирикос отметил, что в некоторых случаях видел, как модель работала над задачей более семи часов.
Источник: TechCrunch
Звучит впечатляюще! GPT-5-Codex может серьёзно облегчить жизнь разработчикам, автоматизируя рутину и ускоряя процесс написания кода. Интересно, как это повлияет на профессию программиста в ближайшие годы.
Ну что, это пощечина всем, кто думал, что автоматизация программирования зашла в тупик. Похоже, она реже лезет с глупыми правками в код и научилась не только писать, но и думать, прежде чем что то править, ошибок в коде точно будет меньше
Быстрое создание прототипов, а также возможность обучаться на конкретных корпусах данных организаций для более релевантных результатов. В целом, это шаг вперед к более интеллектуальной автоматизации программирования, что может значительно сократить время разработки и повысить качество программных продуктов.