Google представила Gemini 2.5, «размышляющую» перед ответом

Комментарии

Фотографы - это специально для вас! Topaz Labs не только распознает проблему испорченного кадра, но и предложит именно тот способ…

Интересная платформа. InVideo AI подходит для быстрого создания контента без навыков видеомонтажа, но для сложных проектов может потребоваться ручная доработка.…

Ученым это конечно в помощь. Это действительно может освободить для них достаточно времени и сил на что-то другое. Но чтобы…

DeepBrain AI — это настоящий прорыв для контент-мейкеров и бизнеса! Возможность создавать реалистичные видео с виртуальными ведущими без студии и…

Это интересное явление, которое отражает растущую популярность робототехники и инновационных технологий в Китае. Роботы-футболисты привлекают внимание своей новизной, технологической сложностью…

Gemini 2.5 Pro Experimental которая, по заявлению компании, является самой интеллектуальной из всех её моделей, доступна на платформе разработчиков Google AI Studio, а также в приложении Gemini для подписчиков тарифного плана Gemini Advanced стоимостью 20 долларов в месяц.

В дальнейшем, по словам Google, все новые модели ИИ будут обладать способностью к рассуждению.

С тех пор как в сентябре 2024 года компания OpenAI запустила первую модель ИИ для логических рассуждений o1, технологическая индустрия стремится превзойти возможности этой модели. Сегодня у Anthropic, DeepSeek, Google и xAI есть модели ИИ для логических рассуждений, которые используют дополнительные вычислительные мощности и время для проверки фактов и решения проблем, прежде чем выдать ответ.

Методы логического мышления помогли моделям ИИ достичь новых высот в решении математических задач и задач по программированию. Многие в мире технологий считают, что модели логического мышления станут ключевым компонентом ИИ-агентов — автономных систем, которые могут выполнять задачи практически без участия человека. Однако эти модели стоят дороже.

Google и раньше экспериментировала с моделями ИИ, в декабре выпустив «мыслящую» версию Gemini. Но Gemini 2.5 — это самая серьёзная попытка компании превзойти модели серии «o» от OpenAI.

Google утверждает, что Gemini 2.5 Pro превосходит предыдущие передовые модели ИИ и некоторые из ведущих конкурирующих моделей ИИ по нескольким показателям. В частности, Google заявляет, что Gemini 2.5 предназначен для создания визуально привлекательных веб-приложений и приложений с агентским кодированием.

По результатам оценки редактирования кода с помощью Aider Polyglot, по словам Google, Gemini 2.5 Pro набирает 68,6%, превосходя лучшие модели ИИ от OpenAI, Anthropic и китайской лаборатории DeepSeek.

Однако в другом тесте, измеряющем способности разработчиков программного обеспечения, SWE-bench Verified, Gemini 2.5 Pro набирает 63,8%, опережая o3-mini от OpenAI и R1 от DeepSeek, но уступая Claude 3.7 Sonnet от Anthropic, который набрал 70,3%.

По данным Google, в «Последнем экзамене человечества» — мультимодальном тесте, состоящем из тысяч вопросов, составленных с помощью краудсорсинга и связанных с математикой, гуманитарными и естественными науками, — Gemini 2.5 Pro набрал 18,8%, показав результат лучше, чем у большинства флагманских моделей конкурентов.

Для начала Google сообщает, что Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов, что означает, что модель ИИ может обрабатывать примерно 750 000 слов за один раз. Это больше, чем вся серия книг «Властелин колец». А вскоре Gemini 2.5 Pro будет поддерживать вдвое большую длину ввода (2 миллиона токенов).

Google не опубликовала цены на API для Gemini 2.5 Pro. Компания сообщает, что поделится дополнительной информацией в ближайшие недели.

Источник: TechCrunch

AI News

Главный редактор
Социальные сети:
Telegram VK Дзен
Rutube YouTube TikTok
Likee: AI News (@creatorproject)

Интересно? Поделиться:

3 комментария к “Google представила Gemini 2.5, «размышляющую» перед ответом”

Главное отличие новой версии Claude 3.7 Sonnet – режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, которой объём размышлений позволит себе модель (это среди прочего влияет и на расходы).

Надеюсь ИИ, который больше размышляет, будет меньше ошибаться. Очень часто они даже не знают что отвечать. Вчера увидел картину старинного художника. Спросил у ИИ как его имя, ИИ ответил что не знает такого. Хотя художник был известный — Витторе Карпаччо.

Google продолжает впечатлять! Gemini 2.5 с функцией «размышления» перед ответом — это шаг в сторону более осознанного ИИ, способного глубже анализировать запросы. Интересно, насколько это улучшит точность ответов и приблизит ИИ к человеческому мышлению. Кто уже протестировал? Какие впечатления? ??

Обсуждение закрыто.

Саша:

27.03.2025 в 20:59

Главное отличие новой версии Claude 3.7 Sonnet – режим размышлений (reasoning), в котором модель сначала сама для себя разбирает задачу и условия, делает предположения, приходит к выводам и затем уже формирует ответ для пользователя. При использовании API разработчики получают контроль над тем, которой объём размышлений позволит себе модель (это среди прочего влияет и на расходы).
Вадим:

27.03.2025 в 21:06

Надеюсь ИИ, который больше размышляет, будет меньше ошибаться. Очень часто они даже не знают что отвечать. Вчера увидел картину старинного художника. Спросил у ИИ как его имя, ИИ ответил что не знает такого. Хотя художник был известный — Витторе Карпаччо.
pipip vovka:

29.03.2025 в 14:22

Google продолжает впечатлять! Gemini 2.5 с функцией «размышления» перед ответом — это шаг в сторону более осознанного ИИ, способного глубже анализировать запросы. Интересно, насколько это улучшит точность ответов и приблизит ИИ к человеческому мышлению. Кто уже протестировал? Какие впечатления? ??