Solar Open 100B: корейский ИИ, который начал с обвинений в плагиате и вышел из этого чище, чем вошел

26.03.202626.03.2026

В конце декабря 2025 года южнокорейский стартап Upstage выпустил Solar Open 100B, большую языковую модель, ставшую одним из первых публичных результатов государственной программы по созданию суверенного корейского ИИ. Релиз прошел довольно скромно, зато уже через два дня о нем знала вся корейская AI-индустрия. Только не по тем причинам, которые планировала компания Upstage. Эксперты Креатор Проджект попытались разобраться, что именно произошло и был ли скандал действительно обоснован.

Смотрите видео на удобном для вас ресурсе!

YouTube ВК.Видео Дзен RuTube ОК

Проверка модели, ставшая резонансной

1 января 2026 года CEO другого корейского стартапа опубликовал разбор, в котором утверждал, что Solar Open 100B похожа на китайскую модель до степени, не объяснимой случайностью. Совпадение в определенных параметрах на уровне 96,8% — разве не убедительно звучит эта цифра? Особенно с учетом того, что проект финансировался государством с условием разработки полностью оригинальной модели с нуля.

Upstage мог уйти в глухую оборону, выпустить пресс-релиз и ждать, пока все утихнет. Вместо этого CEO компании Ким Сонхун сделал нечто редкое для AI-индустрии: 2 января провел открытую публичную верификацию с приглашенными независимыми экспертами, полными обучающими логами, промежуточными чекпоинтами и трансляцией на YouTube. Не закрытое заседание для регулятора, а именно публичный сеанс разоблачения с открытыми дверями.

Логи обучения показали классическую картину: резкий скачок ошибки в начале тренировки и долгое постепенное снижение. Это поведение случайно инициализированной модели, а не дообученной чужой. Высокое сходство в параметрах нормализации, на которое опирался обвинитель, при детальном рассмотрении оказалось технической особенностью, присущей большинству современных моделей похожей архитектуры, а не следом заимствования. 3 января автор обвинений публично извинился, признав, что сделал выводы без достаточной проверки.

Что важно в этой истории, помимо самого факта оправдания: индустрия увидела, как выглядит прозрачность в условиях реальной действительности. Не декларация об открытости в пресс-релизе, а готовность открыть все под давлением. Стоит признать, что это на самом деле большая редкость.

Что модель умеет

Solar Open 100B обучена с нуля на 19,7 трлн. токенов. Архитектура с выборочной активацией экспертов позволяет работать со сложными задачами и при этом не задействовать одновременно всю модель, что снижает нагрузку на железо при сохранении качества. Контекстное окно в 128 тысяч токенов означает возможность работать с очень длинными документами: примерно 200 страниц текста за один раз.

Модель заявляет о себе как о конкурентоспособной сразу в нескольких направлениях. По собственным оценкам компании, Solar Open 100B показала сильные результаты в математических задачах, многошаговом рассуждении, а также агентных сценариях использования, в которых нужно последовательно выполнять несколько связанных действий. В последнем случае модель способна самостоятельно вызывать инструменты, принимать промежуточные решения и не теряться, когда задача состоит не из одного шага, а из целой цепочки.

Upstage — сравнение производительности. Изображение предоставлено Upstage. Источник: https://www.kmjournal.net/news/articleView.html?idxno=7104#google_vignette

Отдельная история – корейский язык и работа с данными, которых глобально мало. Чтобы компенсировать дефицит качественных обучающих текстов на корейском, Upstage активно использовала синтетическую генерацию данных и специализированные наборы из юридической, финансовой, медицинской и других областей. В результате получилась модель, которая хорошо понимает культурные и исторические особенности, умеет работать с отсылками и формулировками, которые большинство западных моделей просто не распознает – для них это лишь шум.

Сообщество разработчиков на Hugging Face восприняло модель в качестве серьезной альтернативы в пространстве открытых решений. Веса открыты, их можно скачать и изучать, что в наши дни само по себе имеет ценность.

Источник: изображение создано при помощи нейросети Dall-E, доступной на сервисе Creator Project

Первая версия как стартовый этап

Solar Open 100B представляет собой первую версию модели из государственной программы, участники которой соревнуются между собой. Пять команд после первого этапа оценки должны были сократиться до четырех; то есть это не финальный продукт, а заявка на место в следующем раунде. Ожидать от нее законченности не стоит.

Практически значимый момент: минимальные требования для локального запуска – четыре видеокарты класса A100. Для большинства организаций это инфраструктура корпоративного уровня, а не что-то доступное в один клик. Государственная программа требовала достичь как минимум 95 % от производительности глобальных лидеров, и насколько это удалось, покажет независимая оценка, а не внутренние тесты. История Solar Open 100B только начинается, и то, каким окажется следующий шаг, во многом определит, был ли декабрьский релиз реальным прорывом или просто хорошим стартом с хорошей развязкой скандала.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Разбор и оценка ИИ-моделей и проектов, внимательно отслеживает развитие технологий и тенденции в области искусственного интеллекта. Аналитические обзоры помогают понять принципы работы ИИ, их возможности и ограничения, дает рекомендации по использованию инновационных решений в различных сферах. Делает сложные темы доступными для широкой аудитории.

Интересно? Поделиться:

Добавить комментарий Отменить ответ

Рекомендуем почитать

IBM Granite

Открытость, переставшая быть маркетингом. Семейство IBM Granite

В сфере больших языковых моделей сформировалась негласная закономерность: чем громче компания говорит о прозрачности, тем меньше информации в действительности она…

Корейская нейросеть K-EXAONE

Корейская нейросеть K-EXAONE: как LG вошла в мировую десятку и что из этого получилось

В мировом рейтинге открытых языковых моделей в течение длительного времени существовало (да и существует по сей день) два полюса –…

Сгенерированная ИИ текстура в игре Crimson Desert

Разработчики Crimson Desert признали использование ИИ-арта и пообещали заменить его

Отзывы о Crimson Desert оказались неоднозначными, однако куда более серьёзной проблемой для игры стало обнаружение в финальном релизе материалов, которые,…

Главная страница Claude Sonnet 4.6

Claude Sonnet 4.6. Средняя модель, которая обогнала флагман

Anthropic выпустила Claude Sonnet 4.6 в феврале 2026 года, и это обновление оказалось неожиданно сильным. Модель улучшилась в кодинге, управлении…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Продолжая использовать наш сайт, вы соглашаетесь с использованием файлов cookie. Они помогают нам обеспечивать корректную работу сайта и делать его более удобным.

Принять

Подробнее…

Политика конфиденциальности