pipip vovka к Музыкальная лаборатория Jukebox. Что умеет и как работает09.06.2025
Ого, не знал, что ИИ уже умеет сочинять музыку с голосом! Послушал пару примеров — звучит неожиданно круто, особенно если…
Sergei к Акселератор StartupDrive провел исследование российских стартапов в области искусственного интеллекта09.06.2025
Исследование показывает, что в России наблюдается значительный рост интереса к стартапам в сфере искусственного интеллекта. Эти компании успешно конкурируют на…
Андрей к Кандинский 3.1. Генеративный прорыв или косметический апдейт?09.06.2025
Kandinsky 3.1 — не косметический апдейт, а генеративный прорыв, сочетающий техническую оптимизацию и расширение возможностей. Модель сохранила сильные стороны предыдущих…
Екатерина к ИИ-аватары озвучивают вердикты судей в Аризоне09.06.2025
Вердикт суда выносит все же человек. Аватары с ИИ только озвучивают для публики это решение. Но есть нюанс. О каком…
Alifa Akter к Звукозаписывающие лейблы ведут переговоры о лицензировании музыки с компаниями Udio и Suno09.06.2025
Интересно наблюдать, как быстро развиваются технологии в области генеративной музыки. Я надеюсь, что соглашения между лейблами и такими компаниями, как…

Google Gemini 1.5 Pro превзошла GPT-4o от OpenAI в бенчмарках генеративного ИИ

В течение последнего года GPT-4o от OpenAI и Claude-3 от Anthropic доминировали на рынке. Однако, по всей видимости, последняя версия Gemini 1.5 Pro вышла на лидирующие позиции.

Один из наиболее признанных эталонов в сообществе ИИ — это LMSYS Chatbot Arena, который оценивает модели по различным задачам и присваивает общий показатель компетентности. В этом рейтинге GPT-4o достиг оценки в 1,286, в то время как Claude-3 получил достойные 1,271. Прошлая версия Gemini 1.5 Pro набрала 1,261.

Экспериментальная версия Gemini 1.5 Pro (обозначенная как Gemini 1.5 Pro 0801) превзошла своих ближайших конкурентов с впечатляющим результатом в 1,300 баллов. Это значительное улучшение предполагает, что последняя модель Google может обладать большими общими возможностями по сравнению с конкурентами.

Стоит отметить, что хотя контрольные показатели предоставляют ценные сведения о производительности модели ИИ, они не всегда точно отражают полный спектр её возможностей или ограничений в реальных приложениях.

Несмотря на доступность Gemini 1.5 Pro в данный момент, тот факт, что она помечена как ранний выпуск или находится на этапе тестирования, предполагает, что Google все еще может внести изменения или даже отозвать модель по соображениям безопасности или соответствия.

Это событие является важной вехой в продолжающейся гонке за превосходство в области ИИ среди технологических гигантов. Способность Google превзойти OpenAI и Anthropic по контрольным показателям демонстрирует быстрые темпы инноваций в этой области и интенсивную конкуренцию, стимулирующую эти достижения.

По мере того как ландшафт ИИ продолжает развиваться, будет интересно наблюдать, как OpenAI и Anthropic ответят на этот вызов от Google. Смогут ли они вернуть себе позиции на вершине рейтинга, или же Google установил новый стандарт производительности генеративного ИИ?

Источник: Artificial Intelligence News

AI News

Главный редактор
Социальные сети:
Telegram VK Дзен
Rutube YouTube TikTok
Likee: AI News (@creatorproject)

Интересно? Поделиться: