Google представила Gemini 2.5, «размышляющую» перед ответом

Gemini 2.5 Pro Experimental которая, по заявлению компании, является самой интеллектуальной из всех её моделей, доступна на платформе разработчиков Google AI Studio, а также в приложении Gemini для подписчиков тарифного плана Gemini Advanced стоимостью 20 долларов в месяц.

В дальнейшем, по словам Google, все новые модели ИИ будут обладать способностью к рассуждению.

С тех пор как в сентябре 2024 года компания OpenAI запустила первую модель ИИ для логических рассуждений o1, технологическая индустрия стремится превзойти возможности этой модели. Сегодня у Anthropic, DeepSeek, Google и xAI есть модели ИИ для логических рассуждений, которые используют дополнительные вычислительные мощности и время для проверки фактов и решения проблем, прежде чем выдать ответ.

Методы логического мышления помогли моделям ИИ достичь новых высот в решении математических задач и задач по программированию. Многие в мире технологий считают, что модели логического мышления станут ключевым компонентом ИИ-агентов — автономных систем, которые могут выполнять задачи практически без участия человека. Однако эти модели стоят дороже.

Google и раньше экспериментировала с моделями ИИ, в декабре выпустив «мыслящую» версию Gemini. Но Gemini 2.5 — это самая серьёзная попытка компании превзойти модели серии «o» от OpenAI.

Google утверждает, что Gemini 2.5 Pro превосходит предыдущие передовые модели ИИ и некоторые из ведущих конкурирующих моделей ИИ по нескольким показателям. В частности, Google заявляет, что Gemini 2.5 предназначен для создания визуально привлекательных веб-приложений и приложений с агентским кодированием.

По результатам оценки редактирования кода с помощью Aider Polyglot, по словам Google, Gemini 2.5 Pro набирает 68,6%, превосходя лучшие модели ИИ от OpenAI, Anthropic и китайской лаборатории DeepSeek.

Однако в другом тесте, измеряющем способности разработчиков программного обеспечения, SWE-bench Verified, Gemini 2.5 Pro набирает 63,8%, опережая o3-mini от OpenAI и R1 от DeepSeek, но уступая Claude 3.7 Sonnet от Anthropic, который набрал 70,3%.

По данным Google, в «Последнем экзамене человечества» — мультимодальном тесте, состоящем из тысяч вопросов, составленных с помощью краудсорсинга и связанных с математикой, гуманитарными и естественными науками, — Gemini 2.5 Pro набрал 18,8%, показав результат лучше, чем у большинства флагманских моделей конкурентов.

Для начала Google сообщает, что Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов, что означает, что модель ИИ может обрабатывать примерно 750 000 слов за один раз. Это больше, чем вся серия книг «Властелин колец». А вскоре Gemini 2.5 Pro будет поддерживать вдвое большую длину ввода (2 миллиона токенов).

Google не опубликовала цены на API для Gemini 2.5 Pro. Компания сообщает, что поделится дополнительной информацией в ближайшие недели.

Источник: TechCrunch

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

AI News

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.

Социальные сети автора:

Интересно? Поделиться:

3 комментария к “Google представила Gemini 2.5, «размышляющую» перед ответом”

Главное отличие новой версии Claude 3.7 Sonnet – режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, которой объём размышлений позволит себе модель (это среди прочего влияет и на расходы).

Надеюсь ИИ, который больше размышляет, будет меньше ошибаться. Очень часто они даже не знают что отвечать. Вчера увидел картину старинного художника. Спросил у ИИ как его имя, ИИ ответил что не знает такого. Хотя художник был известный — Витторе Карпаччо.

Google продолжает впечатлять! Gemini 2.5 с функцией «размышления» перед ответом — это шаг в сторону более осознанного ИИ, способного глубже анализировать запросы. Интересно, насколько это улучшит точность ответов и приблизит ИИ к человеческому мышлению. Кто уже протестировал? Какие впечатления? ??

Обсуждение закрыто.

Google представила Gemini 2.5, «размышляющую» перед ответом

Интересно? Поделиться:

3 комментария к “Google представила Gemini 2.5, «размышляющую» перед ответом”

Рекомендуем почитать

Google выпустила Lyria 3 Pro: генерация музыкальных треков до 3 минут и расширенная кастомизация

Проект AlphaFold. Нейросеть, решившая задачу, над которой ученые бились полвека

Google Maps делает ставку на Gemini: новые ИИ‑функции для поиска мест и навигации

Модель Genie 3. Google DeepMind показывает, как выглядит будущее виртуальных миров

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: