Google представила Gemini 2.5, «размышляющую» перед ответом

Google представила модель ИИ Gemini 2.5, «размышляющую» перед ответом

Gemini 2.5 Pro Experimental которая, по заявлению компании, является самой интеллектуальной из всех её моделей, доступна на платформе разработчиков Google AI Studio, а также в приложении Gemini для подписчиков тарифного плана Gemini Advanced стоимостью 20 долларов в месяц.

В дальнейшем, по словам Google, все новые модели ИИ будут обладать способностью к рассуждению.

С тех пор как в сентябре 2024 года компания OpenAI запустила первую модель ИИ для логических рассуждений o1, технологическая индустрия стремится превзойти возможности этой модели. Сегодня у Anthropic, DeepSeek, Google и xAI есть модели ИИ для логических рассуждений, которые используют дополнительные вычислительные мощности и время для проверки фактов и решения проблем, прежде чем выдать ответ.

Методы логического мышления помогли моделям ИИ достичь новых высот в решении математических задач и задач по программированию. Многие в мире технологий считают, что модели логического мышления станут ключевым компонентом ИИ-агентов — автономных систем, которые могут выполнять задачи практически без участия человека. Однако эти модели стоят дороже.

Google и раньше экспериментировала с моделями ИИ, в декабре выпустив «мыслящую» версию Gemini. Но Gemini 2.5 — это самая серьёзная попытка компании превзойти модели серии «o» от OpenAI.

Google утверждает, что Gemini 2.5 Pro превосходит предыдущие передовые модели ИИ и некоторые из ведущих конкурирующих моделей ИИ по нескольким показателям. В частности, Google заявляет, что Gemini 2.5 предназначен для создания визуально привлекательных веб-приложений и приложений с агентским кодированием.

По результатам оценки редактирования кода с помощью Aider Polyglot, по словам Google, Gemini 2.5 Pro набирает 68,6%, превосходя лучшие модели ИИ от OpenAI, Anthropic и китайской лаборатории DeepSeek.

Однако в другом тесте, измеряющем способности разработчиков программного обеспечения, SWE-bench Verified, Gemini 2.5 Pro набирает 63,8%, опережая o3-mini от OpenAI и R1 от DeepSeek, но уступая Claude 3.7 Sonnet от Anthropic, который набрал 70,3%.

По данным Google, в «Последнем экзамене человечества» — мультимодальном тесте, состоящем из тысяч вопросов, составленных с помощью краудсорсинга и связанных с математикой, гуманитарными и естественными науками, — Gemini 2.5 Pro набрал 18,8%, показав результат лучше, чем у большинства флагманских моделей конкурентов.

Для начала Google сообщает, что Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов, что означает, что модель ИИ может обрабатывать примерно 750 000 слов за один раз. Это больше, чем вся серия книг «Властелин колец». А вскоре Gemini 2.5 Pro будет поддерживать вдвое большую длину ввода (2 миллиона токенов).

Google не опубликовала цены на API для Gemini 2.5 Pro. Компания сообщает, что поделится дополнительной информацией в ближайшие недели.

Источник: TechCrunch

Интересно? Поделиться:

3 комментария для “Google представила Gemini 2.5, «размышляющую» перед ответом

  1. Главное отличие новой версии Claude 3.7 Sonnet – режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, которой объём размышлений позволит себе модель (это среди прочего влияет и на расходы).

  2. Надеюсь ИИ, который больше размышляет, будет меньше ошибаться. Очень часто они даже не знают что отвечать. Вчера увидел картину старинного художника. Спросил у ИИ как его имя, ИИ ответил что не знает такого. Хотя художник был известный — Витторе Карпаччо.

  3. Google продолжает впечатлять! Gemini 2.5 с функцией «размышления» перед ответом — это шаг в сторону более осознанного ИИ, способного глубже анализировать запросы. Интересно, насколько это улучшит точность ответов и приблизит ИИ к человеческому мышлению. Кто уже протестировал? Какие впечатления? 🤔🚀

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *