Недавний отчёт аналитической компании SemiAnalysis проливает свет на истинные затраты, связанные с разработкой китайской языковой модели DeepSeek, опровергая ранее заявленные цифры. Первоначально сообщалось, что обучение модели обошлось всего в 5–6 миллионов долларов, что значительно ниже расходов западных технологических гигантов. Однако, согласно данным SemiAnalysis, реальные затраты DeepSeek значительно выше.
По оценкам, DeepSeek и связанный с ней китайский хедж-фонд High-Flyer инвестировали более 500 миллионов долларов в оборудование, включая около 10 000 графических процессоров Nvidia H800 и 10 000 более мощных чипов H100. Кроме того, компания разместила заказы на ускорители H20, специально разработанные для китайского рынка. Общие капитальные вложения оцениваются примерно в 1,6 миллиарда долларов, а эксплуатационные расходы — около 944 миллионов долларов. Таким образом, суммарные затраты на разработку и поддержку модели могут достигать 2,5 миллиарда долларов, что примерно в 400 раз превышает первоначально заявленные суммы.
DeepSeek была создана в мае 2023 года как дочерняя компания High-Flyer с целью дальнейшего развития ИИ-технологий. Компания активно привлекает таланты из ведущих китайских университетов, предлагая конкурентоспособные зарплаты, превышающие 1,3 миллиона долларов США для перспективных кандидатов. Штат компании насчитывает около 150 сотрудников и продолжает расти.
DeepSeek достигла значительных успехов в области архитектурных инноваций, включая внедрение Multi-Token Prediction (MTP) и модели Mixture-of-Experts (MoE). Эти подходы позволяют улучшить производительность модели и снизить затраты на обучение. Однако разработка таких инноваций требует значительных инвестиций в исследования и разработки, а также в вычислительные ресурсы.
Анализ SemiAnalysis показывает, что ранее заявленные низкие затраты на обучение модели DeepSeek не отражают полной картины расходов. Реальные затраты на разработку и поддержку модели значительно выше, что свидетельствует о том, что создание передовых языковых моделей по-прежнему требует значительных финансовых и технических ресурсов.
Источник: Новая Наука
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter. Можете написать лучше? Мы всегда рады новым авторам.

Статьи и новости о нейросетях и искусственном интеллекте, просто и понятно о сложных технологиях. Освещает современные тенденции, объясняет, как работают ИИ-системы, и показывает, каким образом нейросети меняют различные сферы жизни. Регулярно собирает подборки и топы полезных нейросетей, тщательно отбирая актуальные инструменты и сервисы, которые могут существенно упростить рабочие и повседневные задачи. В своих подборках делится описаниями возможностей каждой нейросети, а также рекомендациями по их применению, чтобы помочь читателям быстро разобраться в новых технологиях и использовать их с максимальной пользой.
Социальные сети автора:






Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: