Le Chat, доступный на портале Mistral AI, в последнее время становится все более востребованным; немало пользователей выражают мнение относительно того, что именно он станет главным потенциальным конкурентом ChatGPT. Однако на самом ли деле это так? Попробуем разобраться детальнее.
Что представляет собой Mistral AI
Mistral — стартап, созданный французскими разработчиками и завоевавший известность своим чат-ботом под названием Le Chat. Работа данного бота основывается на нескольких языковых моделях. Эти модели, собственно, принадлежат компании Mistral. В их число входят Mistral Large, а также Mistral Small и Mistral Next. Все данные модели доступны к использованию при помощи Le Chat. Их основным плюсом является высокая производительность (в том числе и в сравнении с такими гигантами отрасли, как ChatGPT и Gemini).
Как пользоваться нейросетью. Примеры генераций
Использовать данную модель очень просто. После регистрации пользователь сразу же попадает в личный кабинет, в котором можно начать диалог с нейронной сетью:
Для работы доступны несколько моделей:
- Mistral Large 2, отличающаяся быстротой и мощностью.
- Codestrial — как и следует из ее названия, эта модель специализируется на помощи в написании кода.
- Mistral Nemo, быстрая и малозатратная модель.
- Pixtral. Принимает промпты как в текстовом виде, так и в формате изображений.
Давайте посмотрим, как отвечает Le Chat на запросы пользователей. Ниже можно увидеть ответ на вопрос о том, как заработать при помощи нейросетей, не обладая навыками в технологических областях:
В данном случае чат-бот предложил несколько идей, которые и являются ответом на поставленный вопрос. Затем мы попросили нейросеть выполнить еще одно задание — написать эссе о том, что такое счастье. Нейросети в процессе тестирования довольно часто просят написать эссе; ведь именно так проще оценить, насколько творчески они отвечают на поставленные им вопросы. Нужно отметить, что Mistral справилась с этим заданием неплохо. Часть ее рассуждения можно увидеть ниже:
Далее мы сделали еще один запрос, используя модель Pixtral. Данный чат-бот, как было указано выше, возможность указания промпта не только в текстовом варианте, но также и с помощью изображений. Мы загрузили картинку и попросили нейронную сеть описать, что именно на ней изображено.
Оригинал изображения:
Изображение создано при помощи нейросети Dall-E, доступной на сервисе Creator Project
Ответ модели вы можете увидеть ниже:
Полный текст ответа:
Никаких сложностей с тем, чтобы распознать показанное на картинке, нейросеть не испытала. Она мгновенно проанализировала изображение и выдала точные результаты.
Популярность Le Chat: чем она объясняется?
Как объясняется высокая популярность этой нейросети? Вся соль — в высокой производительности при меньшем количестве параметров. Объясним на примере. Некто строит нечто из небольших кирпичиков. Чем больше у него будет этих кирпичиков, тем большего размера выйдет постройка. Модели ИИ работают также. У них есть различные аспекты, которые измеряются в «параметрах»; это своего рода «кирпичики» для ИИ.
Например, когда говорят о параметрах «7B» или «70B» — у модели есть 7 миллиардов или 70 миллиардов этих «кирпичиков», которые она при своей работе использует и для понимания текста, и для генерации ответов. Модели, которые оснащаются большим количеством параметров, являются более производительными. Они дают ответы, отличающиеся большей точностью и сложностью. Модель ChatGPT имеет 1,76 триллиона параметров; Mistral обладает от 7 до 56 миллиардов параметров. Разница ощутимая! Это объясняет, почему многие интересуются моделью Mistral – она показала хорошие результаты, используя гораздо меньше «кирпичиков».
Производительность нейросети зависит не только от количества параметров, но и от того, как эти параметры используются и обучаются. Оптимизация архитектуры, лучшие методы обучения, целевая специализация (предполагающая адаптацию к решению определенных типов заданий) — все это факторы, которые могут объяснить высокое качество работы и, как следствие, успех нейронной сети Mistral.
Мы рекомендуем Mistral AI для работы с различными видами задач. Эта модель отлично справляется с генерацией текста, обработкой предоставленных ей данных и многими другими задачами.