NVIDIA представила супермозг: Llama 3.1 еще умнее и полезнее

Логотип Llama 3.1-Nemotron-70B-Instruct

Компания NVIDIA объявила о выпуске усовершенствованной версии крупной языковой модели Llama 3.1-Nemotron-70B-Instruct. Новая разработка призвана значительно повысить качество и эффективность взаимодействия искусственного интеллекта с пользователями.

Главной особенностью обновленной модели стала её способность генерировать более полезные и релевантные ответы на запросы пользователей. Модель построена на базе архитектуры Transformer и поддерживает обработку впечатляющего объема данных – до 128 тысяч токенов на входе и 4 тысяч токенов на выходе.

В процессе разработки специалисты NVIDIA использовали комбинированный подход к обучению модели, включающий как человеческие данные, так и синтетические материалы. Для тренировки было задействовано более 20 тысяч пар запросов и ответов, а еще тысяча использовалась для валидации. Основной целью такого обучения было создание модели, которая может предоставлять более достоверные, логичные и полезные ответы пользователям.

Важным преимуществом новой версии стала её совместимость с широким спектром аппаратного обеспечения NVIDIA, включая архитектуры Ampere, Hopper и Turing. Модель оптимизирована для работы на различных GPU, от мощных H100 до более доступных A100.

Разработчики уделили особое внимание этическим аспектам использования технологии. NVIDIA подчеркивает важность ответственного подхода к развитию искусственного интеллекта и призывает разработчиков тщательно оценивать соответствие модели требованиям конкретной отрасли и предусматривать возможные риски неправильного использования.

Модель доступна для коммерческого использования при условии согласия с лицензионным соглашением Llama 3 и политикой конфиденциальности. Компания также запустила платформу для сообщения о потенциальных уязвимостях и проблемах безопасности, связанных с использованием модели.

Источник: SecurityLab.ru

Интересно? Поделиться: