Gemini 2.5 Pro Experimental которая, по заявлению компании, является самой интеллектуальной из всех её моделей, доступна на платформе разработчиков Google AI Studio, а также в приложении Gemini для подписчиков тарифного плана Gemini Advanced стоимостью 20 долларов в месяц.
В дальнейшем, по словам Google, все новые модели ИИ будут обладать способностью к рассуждению.
С тех пор как в сентябре 2024 года компания OpenAI запустила первую модель ИИ для логических рассуждений o1, технологическая индустрия стремится превзойти возможности этой модели. Сегодня у Anthropic, DeepSeek, Google и xAI есть модели ИИ для логических рассуждений, которые используют дополнительные вычислительные мощности и время для проверки фактов и решения проблем, прежде чем выдать ответ.
Методы логического мышления помогли моделям ИИ достичь новых высот в решении математических задач и задач по программированию. Многие в мире технологий считают, что модели логического мышления станут ключевым компонентом ИИ-агентов — автономных систем, которые могут выполнять задачи практически без участия человека. Однако эти модели стоят дороже.
Google и раньше экспериментировала с моделями ИИ, в декабре выпустив «мыслящую» версию Gemini. Но Gemini 2.5 — это самая серьёзная попытка компании превзойти модели серии «o» от OpenAI.
Google утверждает, что Gemini 2.5 Pro превосходит предыдущие передовые модели ИИ и некоторые из ведущих конкурирующих моделей ИИ по нескольким показателям. В частности, Google заявляет, что Gemini 2.5 предназначен для создания визуально привлекательных веб-приложений и приложений с агентским кодированием.
По результатам оценки редактирования кода с помощью Aider Polyglot, по словам Google, Gemini 2.5 Pro набирает 68,6%, превосходя лучшие модели ИИ от OpenAI, Anthropic и китайской лаборатории DeepSeek.
Однако в другом тесте, измеряющем способности разработчиков программного обеспечения, SWE-bench Verified, Gemini 2.5 Pro набирает 63,8%, опережая o3-mini от OpenAI и R1 от DeepSeek, но уступая Claude 3.7 Sonnet от Anthropic, который набрал 70,3%.
По данным Google, в «Последнем экзамене человечества» — мультимодальном тесте, состоящем из тысяч вопросов, составленных с помощью краудсорсинга и связанных с математикой, гуманитарными и естественными науками, — Gemini 2.5 Pro набрал 18,8%, показав результат лучше, чем у большинства флагманских моделей конкурентов.
Для начала Google сообщает, что Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов, что означает, что модель ИИ может обрабатывать примерно 750 000 слов за один раз. Это больше, чем вся серия книг «Властелин колец». А вскоре Gemini 2.5 Pro будет поддерживать вдвое большую длину ввода (2 миллиона токенов).
Google не опубликовала цены на API для Gemini 2.5 Pro. Компания сообщает, что поделится дополнительной информацией в ближайшие недели.
Источник: TechCrunch

Главный редактор
Социальные сети:
Telegram: https://t.me/creatorproject_ru
VK: https://vk.com/novosti_ai
Дзен: https://dzen.ru/ainewscp
RuTube: https://rutube.ru/channel/58102633/
YouTube: https://www.youtube.com/@creatorproject_ru
TikTok: https://www.tiktok.com/@creatorproject_ru
Likee: AI News (@creatorproject)
Главное отличие новой версии Claude 3.7 Sonnet – режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, которой объём размышлений позволит себе модель (это среди прочего влияет и на расходы).
Надеюсь ИИ, который больше размышляет, будет меньше ошибаться. Очень часто они даже не знают что отвечать. Вчера увидел картину старинного художника. Спросил у ИИ как его имя, ИИ ответил что не знает такого. Хотя художник был известный — Витторе Карпаччо.
Google продолжает впечатлять! Gemini 2.5 с функцией «размышления» перед ответом — это шаг в сторону более осознанного ИИ, способного глубже анализировать запросы. Интересно, насколько это улучшит точность ответов и приблизит ИИ к человеческому мышлению. Кто уже протестировал? Какие впечатления? 🤔🚀