Компания NVIDIA объявила о выпуске усовершенствованной версии крупной языковой модели Llama 3.1-Nemotron-70B-Instruct. Новая разработка призвана значительно повысить качество и эффективность взаимодействия искусственного интеллекта с пользователями.
Главной особенностью обновленной модели стала её способность генерировать более полезные и релевантные ответы на запросы пользователей. Модель построена на базе архитектуры Transformer и поддерживает обработку впечатляющего объема данных – до 128 тысяч токенов на входе и 4 тысяч токенов на выходе.
В процессе разработки специалисты NVIDIA использовали комбинированный подход к обучению модели, включающий как человеческие данные, так и синтетические материалы. Для тренировки было задействовано более 20 тысяч пар запросов и ответов, а еще тысяча использовалась для валидации. Основной целью такого обучения было создание модели, которая может предоставлять более достоверные, логичные и полезные ответы пользователям.
Важным преимуществом новой версии стала её совместимость с широким спектром аппаратного обеспечения NVIDIA, включая архитектуры Ampere, Hopper и Turing. Модель оптимизирована для работы на различных GPU, от мощных H100 до более доступных A100.
Разработчики уделили особое внимание этическим аспектам использования технологии. NVIDIA подчеркивает важность ответственного подхода к развитию искусственного интеллекта и призывает разработчиков тщательно оценивать соответствие модели требованиям конкретной отрасли и предусматривать возможные риски неправильного использования.
Модель доступна для коммерческого использования при условии согласия с лицензионным соглашением Llama 3 и политикой конфиденциальности. Компания также запустила платформу для сообщения о потенциальных уязвимостях и проблемах безопасности, связанных с использованием модели.
Источник: SecurityLab.ru
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.
Социальные сети автора:






Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: