-

글로벌 GPU 컴퓨팅 파워 핵심 동향【2026년05월일24】

2026-05-24

1. 화웨이 선텅 910C 본격 확대, 국산 칩 대체 가속화

화웨이는 이번 주 쿤펑·선텅 개발자 콘퍼런스에서 AI 데이터센터 인프라 전 스택 솔루션을 발표하고, 선텅 910C 및 950PR 칩의 양산 납품을 추진한다. 젠슨 황 CEO는 최근 화웨이가 중국 시장에서 엔비디아의 실질적인 대체재가 되었음을 공개적으로 인정했다. 화웨이는 바이트댄스, 바이두, 차이나모바일 등 대기업과 총 20억 달러 규모의 잠재적 수주 협상을 벌이고 있으며, 2026년까지 선텅 910C 10만 개 출하를 목표로 하고 있다.

2. 최초의 만 카드급 전 스택 국산 지능형 컴퓨팅 클러스터 가동, 연산력 14,000P 달성

국내 최초의 만 카드급 전 스택 자주 제어 가능한 지능형 컴퓨팅 클러스터가 공식 가동되었다. 화웨이의 첨단 칩을 탑재하여 연산력 규모는 11,000P에 이르며, 기존에 가동 중이던 3,000P를 합하면 총 연산력 14,000P에 달한다. 이는 국산 연산력 인프라의 자주 제어 측면에서 중요한 진전을 의미한다.

3. 엔비디아 H100 임대 가격 급등, 글로벌 연산력 '인플레이션' 지속

AI GPU 수요가 지속적으로 높아짐에 따라 Nebius는 6월 1일부터 H100, H200, B200 전 시리즈 GPU 임대 가격을 인상한다고 발표했다. H100은 시간당 2.95달러에서 3.85달러로(약 31% 상승), B200은 5.50달러에서 7.15달러로 인상된다. 가격 인상과 함께 북미 주요 클라우드 서비스 제공업체들은 엔비디아 GB 및 Rubin 랙 시스템을 공격적으로 조달하고 있어, 2026년 AI 추론 연산력 수요를 122% 가까이 폭발적으로 증가시킬 것으로 전망된다.

4. 엔비디아 Vera Rubin 플랫폼 양산 돌입, 조 단위 연산력 수주 기대

엔비디아는 GTC 2026에서 차세대 Vera Rubin 플랫폼이 전면 양산 단계에 돌입했다고 공식 발표했다. 7종의 신규 칩을 통합하고 5가지 랙 시스템을 지원하며, AI를 위해 설계된 초고성능 컴퓨팅으로 조 단위 연산력 수주를 현실화할 전망이다. 주목할 점은 B200 단일 GPU 성능이 MLPerf 테스트에서 H200보다 2.2배 높으며, HBM4 메모리를 탑재한 Vera Rubin의 추론 연산력은 Blackwell의 5배에 달한다는 것이다.

5. H200 대중국 수출 교착 상태: 미국 규제 완화했지만 중국 기업 '제로 발주'

미국이 엔비디아의 고성능 AI 칩 H200의 대중국 수출을 자발적으로 허용했지만, 구매 허가를 보유한 중국 기업들은 집단적으로 '제로 발주'를 택했다. 그 배경에는 까다로운 조건이 붙어 있기 때문이다: 매출의 25%를 미국 정부에 납부해야 하며, 수출 물량은 미국 내 판매량의 50%를 초과할 수 없고, 미국 제3자 연구소의 보안 검사를 거쳐야 한다. 젠슨 황 CEO는 현재 중국 AI 가속기 시장에서 엔비디아의 점유율이 0%라고 인정했다.

6. 중국 국가발개위, 국산 연산력 어댑터화 적극 추진… 그린 전력, 신규 컴퓨팅 센터의 '하드门槛'으로

5월 22일 중국 국가발전개혁위원회는 국내 대규모 AI 모델이 국산 연산력 칩에 대한 어댑터화를 강화하여 자주 제어 가능하도록 지도하겠다고 분명히 밝혔다. 이와 동시에 많은 지역에서 신규 컴퓨팅 프로젝트의 진입 기준을 대폭 높이고 있다: 대규모 컴퓨팅 센터는 반드시 그린 전력 공급 및 에너지 저장 시스템을 갖춰야 하며, 기준 미달 프로젝트는 등록 불가 및 전력망 연계 불가 처리된다.

7. 바이트댄스, 알리바바, 텐센트, 수천억 위안 규모 연산력 구매 러시

바이트댄스는 2026년 AI 자본 지출을 약 2,000억 위안(당초 계획 대비 25% 증가)으로 상향 조정했으며, 이 중 약 850억 위안을 칩 구매에 할당하고 이미 50억 달러 이상의 국산 연산력 제품을 선구매했다. 알리바바는 향후 5년간 클라우드 및 AI 인프라 투자가 종전 가이드라인인 3,800억 위안을 초과할 것이며, 자체 칩인 Pingtouge의 연산력 카드 출하도 가속화하고 있다. TrendForce 보고서에 따르면 북미 및 중국의 9대 주요 클라우드 서비스 제공업체들이 일제히 연간 자본 지출 가이드라인을 상향 조정했으며, 연산력 산업 체인은 공식적으로 '전 체인 인플레이션' 국면에 접어들었다.

8. AMD, 대만(중국 지역) AI 생태계에 100억 달러 투자, MI450 시리즈는 2nm 공정 채택

AMD는 5월 21일 대만(중국 지역) AI 생태계에 100억 달러 이상을 투자한다고 발표하고, 공급망 전략적 협력을 확대하며 차세대 AI 인프라를 위한 첨단 패키징 제조 역량을 강화한다. GPU 측면에서는 2026년 하반기 양산이 예상되는 Instinct MI450 시리즈에 TSMC 2nm 첨단 공정을 적용하고, 최대 432GB HBM4 메모리와 약 19.6TB/s 대역폭을 갖출 예정이다.

9. 국산 연산력 산업 체인 집중 전개: 토큰 공장, 서버 제조, 지능형 컴퓨팅 센터 등

공개 정보를 종합하면, 4월부터 5월 중순까지 중국 내 억 위안 이상의 연산력 입찰 및 낙찰 프로젝트가 최소 67건에 달한다. 이는 국산 서버 구매, GPU 클러스터 구축, 연산력 임대, 토큰 생성 서비스, 지능형 컴퓨팅 센터 EPC 등 여러 핵심 분야를 포괄한다. 주목할 만한 동향으로는: Rongxin Zhiyuan과 Yingtech이 전략적 협력을 체결하여 국산 연산력 서버의 연구개발 및 제조를 공동 추진, Maifushi와 Muxi가 협력하여 해외 지능형 컴퓨팅 센터 구축 및 토큰 경제 생태계 협력, 일부 연산력 기업이 초기 단계에서 4대의 슈퍼노드 서버를 배치하여 1,500장 이상의 GPU를 연결하는 대규모 클러스터로 '토큰 공장'을 구축할 계획 등이 있다.

10. 젠슨 황, FPGA라는 새로운 연산력 투자… 추론 시장이 다음 격전지로

엔비디아는 CUDA라는 안전지대에서 벗어나 FPGA와 GPU를 협력시키는 이종 연산력 솔루션 개발에 주력하고 있다. Vera Rubin 플랫폼이 3분기 양산 출하됨에 따라 이 솔루션은 엣지 컴퓨팅, 산업용 에이전트, 우주 연산력 등 틈새 시장으로 빠르게 확산될 전망이다. 동시에 젠슨 황 CEO는 LPX 등 SRAM 기반 AI 칩은 장기적으로 틈새 시장에 머물 것으로, 추론 시장의 저지연성 및 토큰 속도 설계에 특화되어 있지만 에이전트형 작업에서는 GPU에 미치지 못한다고 인정했다. 종합적으로 보면 AI 연산력 경쟁은 학습 가속에서 추론 시나리오로 전환되고 있으며, 서버 CPU 시장에서 71%의 점유율을 가진 인텔 역시 AI 추론 시대의 중요한 승자 중 하나가 될 것으로 기대된다.

점유율