Solar Open 100B: корейский ИИ, который начал с обвинений в плагиате и вышел из этого чище, чем вошел

В конце декабря 2025 года южнокорейский стартап Upstage выпустил Solar Open 100B, большую языковую модель, ставшую одним из первых публичных результатов государственной программы по созданию суверенного корейского ИИ. Релиз прошел довольно скромно, зато уже через два дня о нем знала вся корейская AI-индустрия. Только не по тем причинам, которые планировала компания Upstage. Эксперты Креатор Проджект попытались разобраться, что именно произошло и был ли скандал действительно обоснован.

Смотрите видео на удобном для вас ресурсе!

Проверка модели, ставшая резонансной

1 января 2026 года CEO другого корейского стартапа опубликовал разбор, в котором утверждал, что Solar Open 100B похожа на китайскую модель до степени, не объяснимой случайностью. Совпадение в определенных параметрах на уровне 96,8% — разве не убедительно звучит эта цифра? Особенно с учетом того, что проект финансировался государством с условием разработки полностью оригинальной модели с нуля.

Upstage мог уйти в глухую оборону, выпустить пресс-релиз и ждать, пока все утихнет. Вместо этого CEO компании Ким Сонхун сделал нечто редкое для AI-индустрии: 2 января провел открытую публичную верификацию с приглашенными независимыми экспертами, полными обучающими логами, промежуточными чекпоинтами и трансляцией на YouTube. Не закрытое заседание для регулятора, а именно публичный сеанс разоблачения с открытыми дверями.

Логи обучения показали классическую картину: резкий скачок ошибки в начале тренировки и долгое постепенное снижение. Это поведение случайно инициализированной модели, а не дообученной чужой. Высокое сходство в параметрах нормализации, на которое опирался обвинитель, при детальном рассмотрении оказалось технической особенностью, присущей большинству современных моделей похожей архитектуры, а не следом заимствования. 3 января автор обвинений публично извинился, признав, что сделал выводы без достаточной проверки.

Что важно в этой истории, помимо самого факта оправдания: индустрия увидела, как выглядит прозрачность в условиях реальной действительности. Не декларация об открытости в пресс-релизе, а готовность открыть все под давлением. Стоит признать, что это на самом деле большая редкость.

Что модель умеет

Solar Open 100B обучена с нуля на 19,7 трлн. токенов. Архитектура с выборочной активацией экспертов позволяет работать со сложными задачами и при этом не задействовать одновременно всю модель, что снижает нагрузку на железо при сохранении качества. Контекстное окно в 128 тысяч токенов означает возможность работать с очень длинными документами: примерно 200 страниц текста за один раз.

Модель заявляет о себе как о конкурентоспособной сразу в нескольких направлениях. По собственным оценкам компании, Solar Open 100B показала сильные результаты в математических задачах, многошаговом рассуждении, а также агентных сценариях использования, в которых нужно последовательно выполнять несколько связанных действий. В последнем случае модель способна самостоятельно вызывать инструменты, принимать промежуточные решения и не теряться, когда задача состоит не из одного шага, а из целой цепочки.

Upstage — сравнение производительности. Изображение предоставлено Upstage. Источник: https://www.kmjournal.net/news/articleView.html?idxno=7104#google_vignette

Отдельная история – корейский язык и работа с данными, которых глобально мало. Чтобы компенсировать дефицит качественных обучающих текстов на корейском, Upstage активно использовала синтетическую генерацию данных и специализированные наборы из юридической, финансовой, медицинской и других областей. В результате получилась модель, которая хорошо понимает культурные и исторические особенности, умеет работать с отсылками и формулировками, которые большинство западных моделей просто не распознает – для них это лишь шум.

Сообщество разработчиков на Hugging Face восприняло модель в качестве серьезной альтернативы в пространстве открытых решений. Веса открыты, их можно скачать и изучать, что в наши дни само по себе имеет ценность.

Источник: изображение создано при помощи нейросети Dall-E, доступной на сервисе Creator Project

Первая версия как стартовый этап

Solar Open 100B представляет собой первую версию модели из государственной программы, участники которой соревнуются между собой. Пять команд после первого этапа оценки должны были сократиться до четырех; то есть это не финальный продукт, а заявка на место в следующем раунде. Ожидать от нее законченности не стоит.

Практически значимый момент: минимальные требования для локального запуска – четыре видеокарты класса A100. Для большинства организаций это инфраструктура корпоративного уровня, а не что-то доступное в один клик. Государственная программа требовала достичь как минимум 95 % от производительности глобальных лидеров, и насколько это удалось, покажет независимая оценка, а не внутренние тесты. История Solar Open 100B только начинается, и то, каким окажется следующий шаг, во многом определит, был ли декабрьский релиз реальным прорывом или просто хорошим стартом с хорошей развязкой скандала.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Интересно? Поделиться:

Добавить комментарий

Оставляя комментарий вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности, соглашаетесь с пользовательским соглашением. Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рекомендуем почитать

Подпишитесь на нашу рассылку

Loading

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.
Принять
Политика конфиденциальности