...

Grok 4.1: улучшенный ИИ от xAI с рекордными результатами в бенчмарках

Принадлежащая Илону Маску компания xAI начала внедрение Grok 4.1 — обновленной версии существующей модели Grok 4.

xAI выпустила две версии модели с рядом улучшений: Grok 4.1 и Grok 4.1 Thinking. Они доступны бесплатно, однако у платных пользователей меньше ограничений.

Смотрите видео на удобном для вас ресурсе!

По утверждению xAI, Grok 4.1 в три раза реже генерирует «галлюцинации» по сравнению с предыдущими версиями, что делает её одной из лучших разработок компании.

Пока неизвестно, насколько хорошо она конкурирует с аналогами, такими как GPT 5.1, которая недавно вышла с улучшениями производительности и эмоционального интеллекта.

Всплывающее окно с представлением Grok 4.1
Источник изображения: BleepingComputer

Однако Text Arena от LMArena поделилась интересной аналитикой о работе Grok 4.1.

Text Arena от LMArena — это открытый инструмент, позволяющий пользователям сравнивать различные большие языковые модели (LLM) посредством слепых, случайных и параллельных тестов.

Согласно ранним бенчмаркам, Grok 4.1 (thinking) и Grok 4.1 достигли новых высот в конкурентной среде Text Arena.

Результаты бенчмарков, на первом месте: Grok 4.1
Источник изображения: LMArena.ai

Согласно результатам, Grok 4.1 (thinking) занимает первое место с баллом 1510, а Grok 4.1 находится на 19 месте с показателем 1437 в лидерборде Arena Expert.

«Это улучшение более чем на 40 баллов по сравнению с Grok 4 fast, которая появилась в Arena всего два месяца назад», — отметили на платформе.

Хотя Grok 4.1 действительно является заметным обновлением, вряд ли она станет лучшей моделью года, поскольку Google готовится выпустить Gemini 3.0, которая может стать самой мощной моделью на сегодняшний день.

Источник: Bleeping Computer

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Один комментарий к “Grok 4.1: улучшенный ИИ от xAI с рекордными результатами в бенчмарках

  1. Интересное обновление — впечатляют темпы развития Grok 4.1 и его результаты в бенчмарках.

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять