-

Глобальный дефицит вычислительных мощностей и восход «китайского решения»

2026-05-24

Резюме

К 2026 году стремительная итерация искусственного интеллекта ввергает мир в беспрецедентный кризис предложения вычислительных мощностей. Зона комфорта, характеризовавшаяся снижением цен на облачные сервисы, полностью исчезла, уступив место усиливающемуся дисбалансу спроса и предложения, задержкам поставок, вызванным геополитическими конфликтами и инфраструктурными узкими местами, а также полномасштабной конкуренции в сфере вычислений как новом измерении глобального технологического противостояния. В этой турбулентной обстановке китайские отечественные вычислительные мощности, опираясь на полную производственную цепочку и уникальное преимущество в стоимости электроэнергии, стремительно прокладывают самостоятельный путь – от замещения чипов к инновациям в системной архитектуре и далее к глобальному экспорту вычислительных услуг. Данный доклад анализирует глубинные причины мирового дефицита вычислений, рассматривает прорывы отечественных вычислительных мощностей и технологические переломные моменты, исследует логику ценообразования и перспективы прибыльности рынка аренды вычислительных ресурсов, а также подробно разбирает стратегическое значение, влияние и преимущества по затратам глобального экспорта «вычислительных мощностей как услуги». Цель – представить многомерную, панорамную картину новой парадигмы вычислительной индустрии.

Глава 1: Глобальный «жёсткий дефицит» вычислительных мощностей – структурная напряжённость и эффект бабочки

В первом квартале 2026 года мировые цены аренды AI-вычислений пережили знаковый скачок: спотовая цена аренды флагманского чипа NVIDIA Blackwell выросла за два месяца с 2,75 до 4,08 долларов за GPU-час – рост на 48%; в то же время цена годового контракта на аренду предшествующего поколения H100 выросла на 40% с октября 2025 года, достигнув 2,35 долларов за GPU-час. Этот взлёт – не краткосрочное колебание, а неизбежный результат переплетения множества глубинных факторов спроса и предложения.

Во-первых, AI-индустрия переживает ключевой структурный переход от «доминирования обучения» к «внедрению инференса». После нового 2026 года объём вызовов токенов у ведущих крупных моделей резко возрос, а внедрение высокочастотных приложений, таких как AI-агенты, мультимодальное взаимодействие и совместная работа агентов, сделало спрос на инференс новым драйвером роста, превзойдя спрос на обучение. Ежедневный средний объём токенов у модели Doubao от ByteDance удвоился за три месяца и в марте 2026 года превысил 120 триллионов. Данные платформы OpenRouter показывают, что в феврале 2026 года объём вызовов токенов китайскими вендорами впервые превзошёл американских вендоров, демонстрируя кластерный рост: в марте он достиг 7,359 триллиона, составив значительную долю в общем объёме вызовов ведущих мировых моделей. Потребление токенов выросло с нескольких сотен за диалог до миллионов и десятков миллионов, превратив вычислительные затраты из разовых в постоянные операционные расходы и резко повысив зависимость от облачной аренды вычислительных мощностей.

Ситуация с предложением ещё более серьёзна. На уровне производства чипов единственный в мире поставщик EUV-литографов ASML может отгружать лишь около 70 установок в год; для создания вычислений уровня 1 ГВт требуется около 3,5 установок EUV, что приводит к дефициту мощностей по производству логических пластин, HBM-памяти и передовых технологических процессов. Сроки поставки NVIDIA и других производителей обычно составляют 6–7 месяцев. Даже при том, что крупнейшие облачные провайдеры наращивают капитальные затраты – ожидается, что в 2026 году четыре крупнейших облачных вендора США превысят 700 млрд долларов, – превращение этих инвестиций в эффективные вычислительные мощности сталкивается с множеством узких мест: крупные клиенты, уже получившие карты, редко высвобождают простаивающие ресурсы, ликвидность спотового рынка иссякает; от одной трети до половины запланированных в США на 2026 год центров обработки данных сталкиваются с задержками или отменой, и основная причина – не цена чипов, а острая нехватка энергетической инфраструктуры: сроки поставки крупных трансформаторов и распределительных устройств достигают нескольких лет, и они сильно зависят от импорта. JPMorgan оценивает глобальный дефицит мощностей ЦОД в 2 ГВт в 2024 году, 3 ГВт в 2025 году и 7 ГВт в 2026 году.

В совокупности, разрыв между спросом и предложением мировых AI-вычислений составил около 11,6% в 2024 году, резко увеличился до 22% в 2025 году и, хотя в 2026 году ожидается его небольшое сокращение до 18,2%, абсолютная величина разрыва (200 EFLOPS) останется выше, чем в 2025 году, а дефицит будет сохраняться на всём прогнозном периоде. Ключевая логика сохранения роста цен на аренду вычислений как минимум в течение двух лет именно в том, что дисбаланс спроса и предложения перешёл из временных колебаний в структурную норму.

Глава 2: Прорыв отечественных вычислительных мощностей – от замещения чипов к инновациям в системной архитектуре

На фоне крайней напряжённости глобальной цепочки поставок вычислительных мощностей китайская индустрия отечественных вычислений вступает в историческое «окно контратаки».

2.1 Рыночный переворот на уровне чипов

Согласно прогнозам Bernstein Research и ряда авторитетных источников, доля NVIDIA на китайском рынке AI-чипов рухнула с 95% три года назад до 8%, а доля отечественных AI-акселераторов превысила 60%, впервые достигнув уровня локализации выше 60%. Данные IDC показывают, что в 2025 году общий объём поставок AI-акселераторов в Китае составил около 4 млн штук, из которых отечественные вендоры поставили 1,65 млн – 41%. Huawei Ascend поставила около 810 тыс. штук, что составляет около 20% рынка; за ней следуют Cambricon, Hygon, Alibaba T-Head и другие.

Прорыв в производительности отечественных чипов особенно важен. В марте 2026 года Huawei официально выпустила ускоритель Atlas 350 на базе нового чипа Ascend 950PR для обучения и инференса, производительность которого в три раза превышает NVIDIA H20, что окончательно развенчивает прежний нарратив о «недостаточной производительности» отечественных чипов. Выручка Cambricon в первом квартале 2026 года достигла 2,885 млрд юаней (рост на 159,56% в годовом исчислении), чистая прибыль, приходящаяся на акционеров материнской компании, – 1,013 млрд юаней (рост на 185,04%). Чип Siyuan 370 при той же вычислительной мощности стоит всего треть от NVIDIA A10. «Shensuan No.2» от Hygon достигает 80% эффективности обучения NVIDIA A100, а архитектура Chiplet и экосистема, подобная CUDA, ускоряют миграцию предприятий. Множество отечественных чипов достигли синхронной адаптации «Day 0» в день выхода модели DeepSeek V4, что свидетельствует о быстром формировании скоординированной экосистемы в отечественной цепочке поставок – производителям чипов больше не нужны длительные циклы отладки.

Стоит подчеркнуть, что этот прорыв – не изолированное технологическое догоняние, а результат полномасштабной системной инновации. Huawei Ascend 950PR оснащён улучшенной совместимостью с программной экосистемой CUDA, позволяя разработчикам плавно переносить модели, ранее работавшие на базе CANN от NVIDIA. Крупнейшие интернет-компании, такие как ByteDance и Alibaba Group, планируют массовые заказы: цена стандартной версии – около 50 000 юаней за чип, высококлассной HBM-версии – около 70 000 юаней. Это знаменует переход отечественных чипов от статуса «пригодных к использованию» к статусу «удобных в использовании», завершая качественный переход от аппаратной автономии к экосистемной координации.

2.2 Масштабное преимущество вычислительной инфраструктуры

По состоянию на конец июня 2025 года количество стандартных стоек в действующих центрах обработки данных Китая достигло 10,85 млн, масштаб интеллектуальных вычислений вырос до 788 EFLOPS, количество развёрнутых высокоскоростных портов 400G увеличилось до 14 060, а средний PUE ЦОД оптимизирован до 1,42. Проект «Перенос вычислений с востока на запад» сформировал 8 узловых центров и 10 кластеров ЦОД, охватывающих 14 провинций восточного, центрального и западного регионов, привлёк более 1 трлн юаней социальных инвестиций и обеспечивает около 80% интеллектуальных вычислительных мощностей страны.

В соответствии с чёткими ориентирами «Пятнадцатой пятилетки» «умеренное опережающее строительство новой инфраструктуры» поднято до уровня государственного стратегического проектирования. Отечественные вычислительные кластеры больше не полагаются исключительно на сравнение производительности отдельных карт, а движутся к инновациям в системной архитектуре, таким как «суперузлы без кабелей» – через архитектуру масштабируемого соединения (Scale Up). Такие вендоры, как Huawei, переходят от догоняния по отдельным картам к конкуренции на уровне стоечных решений, напрямую соперничая с суперузлами NVIDIA GB200. Пекинская платформа взаимосвязи и совместимости вычислений аккумулирует интеллектуальные ресурсы из Тяньцзиня, Хэбэя, Внутренней Монголии и других регионов, превышая 60 EFLOPS, обеспечивая единое планирование «межрегиональное, межсубъектное, межаритектурное».

Глава 3: Перемены на рынке аренды вычислительных мощностей – дивиденды эпохи роста объёмов и цен

3.1 Рост цен и эволюция бизнес-моделей

Ежемесячная плата за 8-карточный голый сервер H100 в первом полугодии 2026 года стабилизировалась на уровне около 75 000 юаней за единицу. Ведущие отечественные облачные провайдеры – Alibaba Cloud, Baidu AI Cloud, Tencent Cloud – в первой половине 2026 года последовательно повысили цены на AI-вычислительные продукты, причём рост составил от 5% до более чем 400%. С точки зрения глобальной системы ценообразования, справедливая ежемесячная арендная плата по трёхлетнему фиксированному контракту на сервер NVIDIA H100 составляет 65 000–70 000 юаней, и дефицит вычислительных мощностей того же поколения прочно поддерживает этот ценовой центр.

Ещё более значимым является обновление бизнес-модели аренды. Традиционная модель сдачи в аренду «голых» вычислительных мощностей быстро трансформируется в модель «Модель как услуга» (MaaS) или распределение доходов от токенов – то есть переход от «продажи вычислений» к «продаже токенов». Это обновление, как ожидается, значительно повысит прибыльность и оценку компаний, занимающихся арендой вычислений, сместив их оценку с коэффициента P/E на P/S. К 2026 году объём рынка аренды вычислений в Китае достигнет, по прогнозам, 260 млрд юаней, а годовой темп роста спроса на интеллектуальные вычисления составит 43%, из которых на долю интернет-индустрии придётся 62%, государственных органов – 14%, финансового сектора – 6%, здравоохранения – 5%.

3.2 Ценовая власть продавца в условиях дисбаланса спроса и предложения

В настоящее время общий спрос на интеллектуальные вычисления в Китае достиг 4423 EFLOPS, тогда как эффективное предложение составляет лишь 1590 EFLOPS – разрыв превышает 2800 EFLOPS. NVIDIA уже имеет портфель заказов на сумму более 1 трлн долларов до 2027 года, сроки поставки GPU в среднем составляют 6–7 месяцев. Крупные игроки, «придерживающие» карты, редко высвобождают простаивающие ресурсы; дефицит ключевых компонентов, таких как HBM-память и CPU, достигает 30%–40%.

В этих условиях ведущие облачные провайдеры, такие как Alibaba Cloud и Tencent Cloud, применяют высокодифференцированные ценовые стратегии для разных сегментов клиентов: для средних пользователей с годовыми расходами менее 10 млн юаней, которые не желают создавать собственные GPU-кластеры, цены повышаются в обмен на приоритет вычислительных ресурсов; для новых пользователей скидка сокращена с 60% от прейскурантной цены в прошлом году до 50%; для крупных клиентов с высокими годовыми расходами цены сохраняются. Министерство промышленности и информатизации направляет отрасль на переход от безудержной ценовой войны к рациональному ценообразованию, что дополнительно усиливает переговорную силу продавцов.

Эта ситуация рынка продавца привлекает массовый приток капитала. Xiechuang Data подала заявку на кредитную линию в 50 млрд юаней и добивается листинга в Гонконге, а Hongjing Technology добивается кредитной линии в 60 млрд юаней для создания интеллектуального вычислительного кластера – отрасль вступает в фазу капиталоёмкой экспансии.

Примечательно, что на фоне повышения цен крупными вендорами такие высокоэффективные платформы аренды вычислений, как ominyq.com, предлагают альтернативу для малого и среднего бизнеса и разработчиков. Благодаря тонкой настройке планирования и интеграции простаивающих ресурсов платформа стабильно поддерживает арендные ставки более чем на 10% ниже среднерыночных, становясь редким оазисом низких затрат в условиях дефицита вычислительных мощностей.

Глава 4: Новая конфигурация экспорта вычислений – от экспорта технологий к «цифровому базису»

4.1 Взрывной рост масштабов экспорта

Широта и глубина китайского экспорта вычислительных мощностей значительно превосходят ожидания. Согласно отчёту Cloudpilot, в первом квартале 2026 года общее время вызовов китайских облачных и AI-вычислений зарубежными корпоративными клиентами на платформе превысило 1,2 млрд ядро-часов, что на 280% больше по сравнению с предыдущим кварталом. В шести странах Ближнего Востока доля выигранных контрактов на вычислительные услуги китайских ведущих облачных провайдеров в проектах цифровизации правительств и госкомпаний впервые превысила 50%. В новых корпоративных закупках вычислений на Ближнем Востоке и в Юго-Восточной Азии доли китайских вендоров достигли 35% и 42% соответственно. На развивающихся рынках, таких как Азиатско-Тихоокеанский регион, Ближний Восток и Африка, совокупная доля китайских ведущих облачных провайдеров впервые превысила 50%, сместив традиционных гигантов – AWS и Azure – с доминирующих позиций.

Глубинная логика экспорта токенов – это не просто экспорт вычислений, а замкнутый трёхмерный экспортный цикл «отечественные большие модели + вычисления + китайская электроэнергия»: полная цепочка «офшорный ЦОД → производство токенов → вызов из-за рубежа → законная передача данных» уже реализована. Цена за миллион токенов китайских моделей составляет лишь одну десятую от цены зарубежных аналогов, что при производительности, близкой к мировому первому эшелону, создаёт исключительно значительное ценовое преимущество и становится глобальным паспортом для китайского экспорта токенов.

4.2 Глобальная конкуренция облачных гигантов

Alibaba Cloud, Tencent Cloud и Huawei Cloud – три крупнейших китайских облачных провайдера – расширяются по всему миру разными путями. Alibaba Cloud открыл центр обработки данных в Дубае ещё в 2016 году, создал совместное предприятие с Saudi Telecom Company для строительства двух ЦОД в Эр-Рияде, получил сертификацию высшего уровня Class C в Саудовской Аравии, позволяющую размещать правительственные данные высшей степени секретности; у компании более 40 партнёров на Ближнем Востоке и в Африке, а план зарубежных инвестиций составляет 53 млрд долларов. Tencent Cloud запустил свой первый ближневосточный ЦОД в Саудовской Аравии в 2025 году, направив 150 млн долларов на обслуживание ключевых клиентов, таких как Meituan Keeta и игровые компании. Подход Huawei Cloud ещё более «полностечный» – он привносит на Ближний Восток весь пакет AI-инфраструктуры, включая эффективное энергоснабжение, жидкостное охлаждение и подготовку кадров, обучив около 500 000 студентов и создав 330 партнёрств с ICT-академиями. Различия в стратегиях этих трёх компаний очерчивают богатство китайского экспорта вычислений: от глубокой локализации до точечного позиционирования, от капиталоёмкого строительства до создания экосистем.

Тем временем сервисный план «Единая сеть для выхода на глобальный рынок», запущенный China Telecom, формирует архитектуру «2+16+X», охватывающую 7 пакетов услуг, включая обработку данных, трансграничную электронную коммерцию, экспорт токенов и развёртывание зарубежных ЦОД, обеспечивая мощную базовую поддержку для всестороннего экспорта вычислений.

4.3 Глубокая привязка экспорта вычислений к энергетическому преимуществу

Конечный ров экспорта вычислений коренится в непревзойдённом структурном преимуществе Китая в «энергетическо-вычислительном» дуальном базисе. Цена зелёной электроэнергии на западе Китая составляет всего 0,1–0,3 юаня за кВт·ч – примерно одну четвёртую или одну пятую от уровня Европы и США, при этом затраты на электроэнергию составляют более 70% от общих затрат на инференс токенов. Эта разница в ценах на электроэнергию напрямую снижает себестоимость инференса одного токена в Китае до одной трети – одной пятой от зарубежной. В то время как европейские ЦОД вынуждены закрываться из-за резкого роста цен на энергию, центры обработки данных в Гуйчжоу и Внутренней Монголии пользуются зелёной электроэнергией по цене ниже 0,3 юаня за кВт·ч. Стратегия «Перенос вычислений с востока на запад» размещает китайские интеллектуальные вычислительные центры в основном в западных регионах, богатых энергией, где зелёное электричество имеется в изобилии, а PUE снижен до 1,1, а в некоторых передовых кластерах – до 1,05.

Одновременно внутренние интеллектуальные вычислительные центры за счёт модернизации технологий жидкостного охлаждения и строительства высокоплотных кластеров добились двойного повышения энергоэффективности и коэффициента использования. Отечественные серверы, оптические модули, системы жидкостного охлаждения с холодной пластиной и другие цифровые цепочки поставок встраиваются в экспортные услуги. Это определяет основную конкурентную способность китайского экспорта «вычислений как услуги» – это не просто экспорт оборудования, а интегрированный вывод целого комплекса инфраструктурных возможностей: «китайское электричество + китайские чипы + китайские модели + китайская эксплуатация и обслуживание», что создаёт глобально трудно воспроизводимый барьер соотношения цены и качества.

Глава 5: Влияние и перспективы – от «мировой фабрики» к «экспортёру вычислительных услуг»

5.1 Перестройка глобального вычислительного ландшафта

Скачок вычислительных возможностей Китая и их экспорт глубоко меняют глобальную карту вычислений. Когда разработчики, предприятия и государственные учреждения по всему миру вызывают вычислительные мощности из центров обработки данных в Ханчжоу, Пекине и Шэньчжэне для обучения арабоязычных больших моделей и управления городскими транспортными системами, незаметно формируется децентрализованная форма вычислительной торговли. Эта модель экспорта «вычислений как услуги» обходит традиционные пошлины на оборудование, одновременно «пакетируя и экспортируя» вышестоящие производственные цепочки, такие как серверы, оптические модули и системы жидкостного охлаждения. Саудовские официальные лица прямо заявили, что мощный технический потенциал Китая в области искусственного интеллекта делает его важным партнёром Саудовской Аравии в продвижении AI и цифрового экономического развития – эти государственные доверительные отношения закладывают основу для китайского экспорта вычислений, выходящую за рамки простой коммерции.

5.2 Модернизация экономической структуры и новые полюса роста

От «мировой фабрики» к «глобальному цифровому базису» – Китай совершает ключевой переход от экспорта, интенсивного по труду и ресурсам, к экспорту услуг, интенсивному по технологиям, данным и интеллекту. Модель экспорта «вычислений как услуги» будет стимулировать согласованное развитие всей цепочки вычислительной индустрии, включая ЦОД, зелёную энергетику, технологии жидкостного охлаждения, оптические модули и сетевое проектирование. По мере активизации расчётных услуг в сфере вычислений ожидается повышение доли использования юаня в цифровой торговле и усиление голоса Китая в формировании глобальных правил цифровой торговли.

5.3 Средне- и долгосрочные риски и меры реагирования

Необходимо также чётко осознавать несколько ключевых вызовов, стоящих перед развитием вычислений в Китае. Зарубежные вендоры, такие как NVIDIA, по-прежнему доминируют в сегменте высококлассного обучения с точки зрения влияния и прилипаемости экосистемы; отечественным GPU в ближайшие два года будет трудно полностью покрыть коммерческие потребности в сценариях крупномасштабного замещения. Глобальные AI-агентные приложения продолжают ускоряться, и спрос на вычисления может в любой момент достичь новых пиков; крайняя жёсткость предложения будет долго ограничивать эластичность вычислительных услуг. С геополитической точки зрения, создание зарубежных ЦОД сталкивается с множеством испытаний – суверенитет данных, трансграничное соблюдение требований, пропускная способность энергосетей. Электросети некоторых регионов Центральной Азии и Юго-Восточной Азии уже близки к пределу. В условиях капиталоёмкой модели рынку аренды вычислений также следует опасаться структурных рисков, связанных с чрезмерной экспансией.

В целом структурный дефицит глобального предложения вычислительных мощностей открывает историческое окно для китайских отечественных вычислений – от роли догоняющего к роли лидера. Китайское решение, в центре которого – «независимая инновация чипов + прорыв в системной архитектуре + ров затрат на зелёную энергию + глобализация вычислительных услуг», переопределяет правила глобальной конкуренции в области AI-вычислений. Китай становится не только важным поставщиком мировых вычислительных ресурсов, но и начинает формировать стандарты, культуру и ценностные ориентиры глобальной цифровой инфраструктуры.

Заключение

Это момент многомерных преобразований. Из-за взрывного спроса, производственных узких мест и отставания инфраструктуры глобальные вычислительные мощности погрузились в глубокий дисбаланс спроса и предложения, что коренным образом меняет логику ценообразования эпохи доминирования NVIDIA. На этом промышленном переломе, где кризис и возможности сосуществуют, китайские отечественные вычислительные мощности совершили прорыв от точечных технологических усилий к полномасштабным системным инновациям, от замещения чипов к итерации системной архитектуры, от внутреннего потребления к глобальному экспорту. Форма экспорта «вычислений как услуги» становится вторым по счёту глобальным ключевым конкурентным преимуществом Китая после обрабатывающей промышленности. От дешёвой зелёной энергии в пустынях запада до плотных точек присутствия сверхкрупных цифровых хабов на Ближнем Востоке, от полного самостоятельного контроля программно-аппаратного стека до стратегической высоты экспорта токенов – Китай с беспрецедентной скоростью и глубиной совершает исторический поворот от «потребителя вычислений» к «глобальному вычислительному базису».

Declaration: This article is originally created by Shenzhen Cloud Engine - a cost-effective AI computing power service platform. For reprint, please indicate the source link: http://m.omniyq.com/ru/sys-nd/534.html