-

Глобальные новости о GPU-вычислениях【20260524】

2026-05-24

1. Полномасштабное развёртывание Huawei Ascend 910C, ускорение импортозамещения чипов

На конференции разработчиков Kunpeng Ascend на этой неделе Huawei представила полностековое решение для инфраструктуры центров обработки данных AI, стимулируя массовое производство и поставки чипов Ascend 910C и 950PR. Дженсен Хуанг недавно публично признал, что Huawei стала эффективной заменой NVIDIA на китайском рынке. Huawei ведёт переговоры о потенциальных заказах с такими гигантами, как ByteDance, Baidu и China Mobile, общая стоимость может достичь 2 млрд долларов, цель — поставить 100 000 чипов Ascend 910C в 2026 году.

2. Запущен первый в стране полностью отечественный кластер из 10 000 ускорителей мощностью 14 000 PFlops

Первый в Китае полностью автономный кластер из 10 000 ускорителей для интеллектуальных вычислений официально введён в эксплуатацию. На базе передовых чипов Huawei его производительность достигает 11 000 PFlops, а с учётом ранее введённых 3 000 PFlops суммарная мощность составляет 14 000 PFlops. Это знаменует собой ключевой шаг к созданию независимого отечественного фундамента для вычислительных мощностей.

3. Резкий рост цен на аренду NVIDIA H100, «инфляция» вычислительных мощностей продолжается

Из-за сохраняющегося высокого спроса на AI GPU компания Nebius объявила о повышении с 1 июня стоимости аренды всех серий GPU — H100, H200, B200. Цена на H100 вырастет с 2,95 до 3,85 доллара в час (рост около 31%), на B200 — с 5,50 до 7,15 доллара. Параллельно ведущие облачные провайдеры Северной Америки активно закупают стоечные системы NVIDIA GB и Rubin, что, по прогнозам, приведёт к взрывному росту спроса на вычислительные мощности для логического вывода в 2026 году почти на 122%.

4. Платформа NVIDIA Vera Rubin выходит в массовое производство, ожидаются заказы на триллионные вычислительные мощности

На конференции GTC 2026 NVIDIA официально объявила о начале полномасштабного производства платформы следующего поколения Vera Rubin. Она объединяет семь новых чипов и охватывает пять типов стоечных систем. Производительность суперкомпьютеров, созданных специально для AI, открывает возможность для заказов на триллионные вычислительные мощности. Примечательно, что производительность одного GPU B200 в тестах MLPerf в 2,2 раза выше, чем у H200, а логическая мощность Vera Rubin с памятью HBM4 в 5 раз выше, чем у Blackwell.

5. Экспорт H200 в Китай зашёл в тупик: США ослабили ограничения, но китайские компании не делают заказов

Хотя США добровольно разрешили экспорт высокопроизводительных AI-чипов NVIDIA H200 в Китай, китайские компании, имеющие разрешения на закупку, коллективно отказались от заказов. Причина — жёсткие сопутствующие условия: 25% выручки должны быть переданы правительству США, объём экспорта не может превышать 50% от объёма продаж внутри США, а также требуется проверка безопасности в сторонней американской лаборатории. Дженсен Хуанг признал, что доля NVIDIA на китайском рынке AI-ускорителей в настоящее время равна нулю.

6. Госкомитет по развитию и реформам КНР продвигает адаптацию к отечественным вычислительным мощностям, «зелёная энергия» становится жёстким требованием для новых центров обработки данных

22 мая Госкомитет по развитию и реформам КНР чётко заявил, что будет направлять крупные отечественные модели на усиление адаптации к国产 чипам для обеспечения самостоятельности и контролируемости. В то же время многие регионы значительно повышают порог входа для новых проектов вычислительных центров: крупные ЦОД должны обеспечиваться «зелёной» энергией и системами накопления энергии; проекты, не соответствующие требованиям, не получат регистрации и не будут подключены к электросетям.

7. ByteDance, Alibaba и Tencent развернули закупки вычислительных мощностей на сотни миллиардов юаней

ByteDance увеличила капитальные расходы на AI в 2026 году до примерно 200 млрд юаней (на 25% выше первоначального плана), из которых около 85 млрд юаней пойдут на закупку чипов. Компания уже предварительно заказала отечественную вычислительную продукцию на сумму более 5 млрд долларов. Alibaba в ближайшие пять лет вложит в облачную и AI-инфраструктуру сумму, превышающую ранее объявленный ориентир в 380 млрд юаней, ускоряя поставки вычислительных карт Pingtouge. Согласно отчёту TrendForce, девять крупнейших облачных провайдеров в Северной Америке и Китае совместно повысили свои годовые ориентиры капитальных расходов, что сигнализирует о вступлении цепочки вычислительной индустрии в фазу «полноцепочной инфляции».

8. AMD инвестирует 10 млрд долларов в AI-экосистему Тайваня (Китай), серия MI450 использует 2-нм техпроцесс

21 мая AMD объявила об инвестициях более 10 млрд долларов в AI-экосистему Тайваня (Китай), расширяя стратегическое сотрудничество в цепочке поставок и наращивая мощности по передовой упаковке для инфраструктуры AI следующего поколения. В сегменте GPU ожидаемая к массовому производству во второй половине 2026 года серия Instinct MI450 будет использовать передовой 2-нм техпроцесс TSMC, получит до 432 ГБ памяти HBM4 и пропускную способность около 19,6 ТБ/с.

9. Интенсивное развёртывание отечественной цепочки индустрии вычислительных мощностей: «фабрики токенов», производство серверов, интеллектуальные ЦОД

Согласно публичной информации, с апреля по середину мая в Китае было реализовано не менее 67 проектов по тендерам и закупкам вычислительных мощностей на сумму свыше 100 млн юаней каждый. Они охватывают такие ключевые звенья, как закупка отечественных серверов, строительство GPU-кластеров, аренда вычислительных мощностей, услуги по генерации токенов, инжиниринг и строительство интеллектуальных ЦОД. Примечательные события: Rongxin Zhiyuan и Yingtech подписали стратегическое соглашение о совместной разработке и производстве отечественных серверов для вычислений; Maifushi и Muxi заключили партнёрство в области создания зарубежных интеллектуальных ЦОД и развития экономики токенов; некоторые компании планируют развернуть 4 суперузловых сервера, объединив кластер из более чем 1500 GPU для создания «фабрики токенов».

10. Дженсен Хуанг делает ставку на FPGA как новую вычислительную силу, рынок логического вывода становится следующим полем битвы

NVIDIA выходит из зоны комфорта CUDA и активно разрабатывает гетерогенные вычислительные решения на основе совместной работы FPGA и GPU. По мере начала массовых поставок платформы Vera Rubin в третьем квартале это решение быстро проникнет в такие нишевые сценарии, как периферийные вычисления, промышленные агенты, космические вычисления. В то же время Дженсен Хуанг отметил, что LPX и другие SRAM AI-чипы надолго останутся нишевым продуктом, ориентированным на низкую задержку и скорость токенов при логическом выводе, но уступающим GPU в агентных задачах. В целом конкуренция в сфере AI-вычислений смещается от ускорения обучения к сценариям логического вывода, и Intel, имеющая 71% доли на рынке серверных CPU, также может стать одним из важных победителей эры логического вывода AI.

Поделиться