|
Professor Seleznov
|
Мы в Beeline Cloud продолжаем рассказывать про опенсорс-разработку в Китае. В первой статье вспомнили, как привезли в страну Linux, во второй обсудили, как менялась китайская экосистема до 2020 года. Сегодня говорим о том, как большие языковые модели с открытыми весами стали флагманом китайского опенсорса.

Изображение: Cash Macanaya (Unsplash License) Поддержка сверху В начале текущего десятилетия опенсорс де-факто стал нормой для корпоративного сектора Китая. Тогда в аналитическом центре Китайской академии информационных и коммуникационных технологий (CAICT) провели опрос среди представителей бизнеса и установили, что больше 87% компаний в стране пользовались опенсорс-инструментами. Преимущественно это были СУБД и инструментарий для работы с большими данными. Однако несмотря на распространенность открытых решений, китайские компании отставали от западных в части зрелости управления подобной инфраструктурой. В те годы лишь 24% компаний в Поднебесной выделяли ресурсы на создание команд, отвечающих за опенсорс-процессы. В результате многим организациям не хватало экспертизы в управлении рисками, соблюдении регуляторных требований и решении сопутствующих технических задач. На ситуацию обратило внимание правительство Китая, которое увидело в опенсорсе не просто путь к технологическому суверенитету, но и возможность конкурировать с Западом, и несмотря на санкции, выходить на его рынки со своими решениями. Государство начало принимать активное участие в развитии опенсорс-альянсов и фондов, объединивших государственные агентства, бизнес, исследовательские институты и независимых разработчиков. Пример такого фонда — OpenAtom, основанный в 2020 году при участии крупнейших ИТ-компаний Китая, включая Huawei, Alibaba, Baudi, Tencent. Его часто называли китайским аналогом международных фондов свободного ПО (вроде Apache Software Foundation), ориентированным на глобальное сотрудничество. Якорным проектом фонда стала операционная система OpenHarmony — альтернативная версия Android, которую в правительстве рассматривают в качестве кандидата на звание «национальной». С подачи китайского правительства развивается и альтернатива GitHub — Gitee. Уже в 2020 году на ней были созданы более 10 млн репозиториев, а сервисами платформы воспользовались порядка 5 млн разработчиков. Сегодня в развитии площадки участвуют местные НИИ, организация Open Source China (мы упоминали ее в предыдущей статье), и компании из частного сектора — например, та же Huawei. До показателей GitHub площадка пока недотягивает. На западной платформе размещено как минимум в 10 раз больше репозиториев, которыми пользуются около 31 млн разработчиков, но команда Gitee, не унывает: «Опенсорсную экосистему не построить за день — это все равно что возводить замок из песка. Мы верим в китайских разработчиков». Нейросети, ваш выход Еще до появления моделей вроде DeepSeek, наделавших шуму в западных СМИ, одним из драйверов роста китайского опенсорса считались открытые фреймворки глубокого обучения. Их развивали как альтернативу западным решениям, включая TensorFlow от Google. Одним из известных проектов в этой области является фреймворк PaddlePaddle, разработанный Baidu еще в 2016 году. Он до сих пор поддерживается и получил широкое распространение в промышленном, сельскохозяйственном и корпоративном секторах. Инструментом пользуются больше 23 млн разработчиков из 760 тыс. компаний — среди них: NVIDIA, Intel, Huawei. Еще один фреймворк, который пользуется спросом в промышленном секторе, — это X-DeepLearning, разработанный Alibaba и переданный в опенсорс в 2018 году. XDL позволяет обучать модели с миллиардами параметров всего за несколько часов и закрывает специфическую нишу индустриальных моделей, которым необходимы многомерные разреженные данные. Также стоит отметить Mindspore — фреймворк от Huawei для разработки и обучения ИИ-моделей под мобильные и облачные среды. Все эти фреймворки для глубокого обучения заложили основу для продвинутых языковых моделей, сопоставимых по производительности с американскими аналогами, но при этом их разработка обходилась в разы дешевле. Показательный пример — DeepSeek-V3, обучение которой, по заявлениям авторов, обошлось где-то в 5,5 млн долларов. И эта цифра сильно ниже, если сравнивать с миллиардами, затрачиваемыми западными компаниями вроде OpenAI. Неудивительно, что появление модели спровоцировало турбулентность на рынке технических компаний. В частности, NVIDIA за один день потеряла 593 млрд долларов капитализации, что стало крупнейшим однодневным падением в истории Уолл-стрит. В 2025 году было опубликовано исследование специалистов из Массачусетского технологического института, Университета Южной Калифорнии, площадки Hugging Face и других организаций, которое показало, что китайские опенсорсные модели превзошли американские по количеству загрузок. Команда специалистов проанализировала историю загрузок на Hugging Face с 2020 по 2025 годы и изучила каталог репозитория моделей глубокого обучения ModelHub. Всего в выборке оказалась 851 тыс. моделей, которые пользователи скачали больше 2 млрд раз. В итоге удалось установить, что за обозначенный период общая доля скачиваний китайских моделей составила 17,1% (для американских моделей процент загрузок составил 15,8%). Эти выводы подтвердила статистика магазинов приложений: в начале 2025 года DeepSeek ворвался в топ скачиваний в США среди чат-ботов, обойдя конкурента — ChatGPT (и сделал он это всего за неделю с момента релиза). Что интересно, DeepSeek — один из самых громких, но далеко не первый опенсорсный успех Китая в сфере машинного обучения и систем ИИ. Компания Qwen Lab годами выпускала модели с открытыми весами, и к сентябрю 2024 года количество их загрузок по всему миру превысило 600 млн. На платформе Hugging Face на ИИ-модели Qwen приходилось более 30% всех скачиваний на тот момент.

Изображение: Lance Matthew Pahang (Unsplash License) В интервью журналу MIT Technology Review генеральный директор компании Atoms, которая занимается разработкой ИИ-агентов, комментируя успех китайских моделей, отметил то, как изменилась обстановка на рынке интеллектуальных решений за последние годы: «Еще тридцать лет назад никто бы не подумал, что Китай станет центром глобальных инноваций». Сегодня такие компании, как Z.ai, MiniMax и Tencent тоже выпускают модели, которые не уступают западным в рассуждениях, написании кода и агентских задачах. Причем китайская экосистема моделей машинного обучения становится все более специализированной. Так, AI Laboratory работает над моделью Intern-S1-Pro, которая имеет триллион параметров. Она заточена под работу с техническими и научными задачами по химии, биологии, материаловедении (например, умеет предсказывать свойства молекул и материалов, интерпретировать химические данные). Модель для медицинских задач запустили в компании Ubiquant — ИИ-система называется Fleming-R1. И она способна диагностировать редкие заболевания и рекомендовать лекарства и курс лечения. Специализированные ИИ-системы в Китае развивают не только для научных, но и творческих задач — например, Tencent работает над моделями для генерации и распознавания музыки. Модель LeVo 2 уже не уступает закрытым коммерческим продуктам и хорошо распознает тексты песен — показатель ошибок в фонемах на уровне 8,5% против 10% и выше у конкурентов. Как китайский опенсорс повлиял на Запад В Кремниевой долине все чаще отдают предпочтение китайским моделям — Мартин Касадо, генеральный партнер ведущей венчурной фирмы Andreessen Horowitz, так описывает расстановку сил: «Стартапы, представляющие свои опенсорсные проекты, примерно в 80% случаев работают на основе китайских открытых моделей». В 2025 году исследователи API-агрегатора больших языков моделей OpenRouter изучили метаданные нескольких миллиардов запросов от всех пользователей платформы за последние два года. В итоге выяснилось, что использование китайских открытых моделей выросло на 30% практически с нуля — спрос особенно подскочил во второй половине 2025 года.
У китайской компании Z.ai количество пользователей росло так быстро, что руководству даже пришлось ограничить новые подписки на свою нейросеть, сославшись на нехватку вычислительных мощностей. При этом значительная часть их пользователей сконцентрирована именно в США.
Китайские разработчики систем ИИ видят во всем этом возможности и начинают выходить на западные площадки и социальные сети, чтобы рассказывать о китайских решениях. Например, в конце прошлого года основатель Moonshot AI Янг Чжилинь запустил на реддите тред в популярном на площадке формате «Спроси меня о чем угодно» (Ask Me Anything), где вместе с костяком команды, работавшей над моделью Kimi, отвечал на вопросы англоязычной аудитории. В Z.ai также создавали похожие тематические обсуждения. Как говорят специалисты, знакомые с китайской культурой разработки, еще несколько лет назад трудно было представить что-то подобное от китайских опенсорсных команд. Вместе с навыками построения комьюнити вокруг своих продуктов, китайские разработчики отточили коммерческое «чутье». Как только агентский фреймворк OpenClaw сразил интернет в начале 2026 года, компании Moonshot AI и MiniMax одними из первых предложили для него готовое решение с минимальными требованиями к настройке. Следом за ними аналогичным образом поступил триумвират Baidu, Alibaba и Tencent. Профессор информатики в университете Ли Жуань считает, что в Китае опенсорс, наконец, приобрел культурный вес и способен составить здоровую конкуренцию западным решениям. Параллельно усиливается и роль академической среды: китайские университеты поддерживают и стимулируют студентов участвовать в разработке проектов на основе систем ИИ и открытых технологий в целом. Согласно новой политике Госсовета КНР, вклад в опенсорс напрямую влияет на академические оценки и дает студентам дополнительные преимущества. И Китай, вероятно, продолжит делать ставку на развитие открытых моделей как инструмент расширения своего присутствия на глобальном рынке.
Beeline Cloud— безопасный облачный провайдер. Разрабатываем облачные решения, чтобы вы предоставляли клиентам лучшие сервисы.
Что еще почитать в нашем блоге и на нашей DIY-площадке:
-Источник
|