Открытость, переставшая быть маркетингом. Семейство IBM Granite

В сфере больших языковых моделей сформировалась негласная закономерность: чем громче компания говорит о прозрачности, тем меньше информации в действительности она готова реально раскрывать. IBM решила сыграть иначе. Пока большинство игроков рынка в 2025 году тихо отступали от собственных деклараций об открытости, IBM двигалась в противоположную сторону. Результат не заставил себя долго ждать: Стэнфордский индекс прозрачности фундаментальных моделей поставил IBM Granite на первое место с результатом 95 %, и это наивысший балл за всю историю индекса. Разрыв с ближайшим конкурентом составил 23 процентных пункта, а от среднего значения по рынку в 41 % Granite отделяло больше полусотни пунктов. Цифры говорят сами за себя, и интерпретировать их особо не надо.

Смотрите видео на удобном для вас ресурсе!

Что такое Granite и зачем он вообще нужен

Вышеупомянутый Стэнфордский индекс («Stanford Foundation Model Transparency Index») оценивает модели по ста различным параметрам: источники данных, оценка рисков, открытые веса, воспроизводимость результатов, протоколы отчетности об инцидентах, политика использования данных. По 10 из 15 ключевых категорий IBM Granite набрал идеальные 100 баллов. По категории Data Properties, в которой IBM получила максимум, 8 других компаний из 13 участников заработали ноль. Средний балл по этой категории составил 14. Это не конкурентное преимущество в обычном понимании; скорее, речь идет о принципиально другом подходе к тому, что вообще значит делать ИИ-продукт.

IBM открыла исходный код моделей Granite еще в 2024 году, но в компании справедливо указывают, что открытость и прозрачность – совершенно не одно и то же. Можно опубликовать код и при этом ничего не сообщить о том, на каких данных обучалась модель, как оценивались риски и что происходит с данными пользователей. Именно этот разрыв Granite закрывает. Кушу Варшни, руководителю направления безопасности в компании IBM Research, принадлежит формулировка: «IBM Granite следует концепции «с фермы к столу». Смысл простой: так же, как люди хотят знать происхождение своей еды, предприятия должны понимать, из чего сделан их ИИ.

Пример работы модели

Для кого предназначена разработка

Granite в действительности представляет собой не один продукт, а целое семейство языковых моделей разного размера, каждая из которых заточена под конкретный сценарий использования. Целевой аудиторией выступает корпоративный сектор: компании, которым нужен ИИ не для экспериментов в духе «посмотрим, что будет», а для встраивания в реальные рабочие процессы с понятными требованиями к безопасности и управляемости. Granite не пытается быть универсальным решением для всех. Он целенаправленно закрывает задачи, которые реально стоят перед бизнесом: обработка документов, работа агентных систем с множеством инструментов, автоматизация клиентской поддержки, код, анализ данных и прочие.

Представленные модели

Семейство Granite 4.0 включает несколько моделей под разные задачи и аппаратные ограничения. На одном конце Micro с тремя млрд. параметров; она предназначена для выполнения высокообъемных задач, где главное – скорость и стоимость (суммаризация, классификация, извлечение данных и другие). На другом конце Small с 32 млрд. суммарных параметров, из которых во время инференса активны только 9 млрд. Данная модель была разработана для выполнения сложных сценариев, в которых нужна более глубокая работа с текстом. Между ними располагается Tiny с 7 млрд. суммарных и 1 млрд. активных параметров – для приложений с жесткими требованиями к задержке и для развертывания непосредственно на устройствах.

Отдельно стоит упомянуть Nano, совсем маленькие модели, которые были созданы для устройств с ограниченными вычислительными ресурсами. Они демонстрируют высокую производительность для своего размера на бенчмарках по знаниям, математике, коду и безопасности, а на задачах критичного для агентных сценариев плана (в следовании инструкциям, вызове функций) обгоняют несколько сопоставимых по размеру моделей от других разработчиков.

Granite не пытается конкурировать с GPT-4 или Claude Opus по сложности рассуждений в открытых задачах. IBM намеренно делает акцент именно на устойчивости в задачах, релевантных корпоративным сценариям, а не на победах в обобщенных бенчмарках. И это осознанный выбор, а не недостаток, однако его стоит понимать перед тем, как выбирать инструмент. Эксперты Креатор Проджект отмечают: если нужна модель для открытого творческого письма или сложных рассуждений без структурированного контекста, Granite – не первый кандидат. Если нужна модель для работы с документами, автоматизации бизнес-процессов, агентных систем с вызовом инструментов или развертывания в регулируемой среде, то здесь картина выглядит значительно интереснее.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рекомендуем почитать

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять
Политика конфиденциальности