캘리포니아주 새너제이 – 2026년 3월 17일 – 트레이드마크인 가죽 재킷을 입은 NVIDIA의 창립자이자 CEO인 젠슨 황이 SAP 센터의 스포트라이트를 받으며 무대에 등장했을 때, 그의 손에 들려 있던 것은 더 이상 단순한 새로운 칩이 아니었다. 그가 대신 펼쳐 보인 것은 지상의 데이터 센터에서 궤도 우주 플랫폼에 이르는 웅장한 청사진이었다. GTC 2026은 단순한 하드웨어 발표회가 아니라 'AI 경제학'의 재정의의 장이 되었다. 황 CEO는 세계를 향해 핵심 명제를 제시했다. 즉, 토큰은 새로운 통화이며, AI 공장은 그것을 생산하는 인프라라는 것이다.
황 CEO는 기조연설 서두에서 놀라운 예측을 내놓았다. 2027년까지 Blackwell 및 Vera Rubin 시스템에 대한 시장 수요는 최소 1조 달러의 수익을 창출할 것이라는 것이다. 이 수치는 작년 예측에서 두 배로 증가한 수치다. 그는 AI가 '모델 훈련 시대'에서 '모델 추론 시대'로 급속히 전환되고 있다고 지적했다. 과거에는 모델 훈련에 필요한 컴퓨팅 성능이 주목받았지만, 현재는 모델이 실제 애플리케이션에 배포되면 모든 대화와 이미지 생성에 막대한 추론 컴퓨팅이 필요하게 된다.
"모든 데이터 센터, 모든 공장은 정의상 전력에 의해 제한됩니다. 1GW 공장이 결코 2GW가 될 수 없는 것은 물리와 원자의 법칙입니다." 젠슨 황은 '토큰 공장 경제학' 을 처음으로 체계적으로 설명했다. 즉, 고정된 전력 범위 내에서는 와트당 토큰 처리량이 가장 높은 주체가 가장 낮은 생산 비용을 달성한다는 것이다. 그는 미래 AI 서비스의 5가지 상용 등급(무료 등급에서 초고속 등급까지)을 개략적으로 설명하며, 기업의 경쟁력은 이러한 인텔리전스 토큰을 생산하는 비용과 효율성에 직접적으로 좌우될 것이라고 주장했다.
이번 GTC에서 가장 중요한 발표는 단연 차세대 AI 플랫폼 'Vera Rubin' 이었다. 이것은 더 이상 단순한 GPU가 아니라 컴퓨팅, 네트워킹, 스토리지를 포괄하는 7개의 개별 칩으로 구성된 거대한 시스템으로, 단일한 협력 슈퍼컴퓨터처럼 기능하도록 설계되었다.
새롭게 자체 개발된 Vera CPU에 스포트라이트가 집중되었다. 88개의 커스텀 'Olympus' 코어를 탑재한 이 데이터 센터 프로세서는 에이전트 AI 및 강화 학습 전용으로 설계된 세계 최초의 CPU이다. LPDDR5X 메모리를 채택하여 1.2TB/s의 대역폭을 자랑하며 에너지 효율은 두 배로 향상되었다. 황 CEO는 "비교할 수 없는 단일 스레드 성능과 효율성"을 강조했다. Vera CPU는 NVLink-C2C 인터커넥트를 통해 Rubin GPU에 연결되어 1.8TB/s라는 거대한 일관성 대역폭을 제공하며, AI의 '사고'를 구동하는 핵심이 된다.
Rubin GPU도 마찬가지로 경이롭다. TSMC의 3나노 공정으로 제조되었으며, 3,360억 개의 트랜지스터를 집적하고 288GB의 HBM4 메모리를 탑재했으며 메모리 대역폭은 22TB/s에 달한다. FP4 정밀도로 측정된 추론 컴퓨팅 성능은 무려 50 PFLOPS로 Blackwell의 5배이며, 훈련 컴퓨팅 성능은 35 PFLOPS로 Blackwell의 3.5배를 넘어선다. 완전한 Vera Rubin NVL72 랙은 260TB/s의 NVLink 6 대역폭을 갖추고 있다. NVIDIA에 따르면 이는 이미 인터넷 전체의 총 대역폭을 초과하는 수치이다.
| 칩/플랫폼 | 주요 사양 | 성능 향상 |
|---|---|---|
| Vera CPU | 88코어 ARM, LPDDR5X 메모리, 1.2TB/s 대역폭 | 기존 CPU 대비 2배 효율 |
| Rubin GPU | 3nm 공정, 3360억 트랜지스터, 288GB HBM4 | FP4 추론 50 PFLOPS, Blackwell의 5배 |
| Vera Rubin NVL72 | Rubin GPU 72개 + Vera CPU 36개 | 토큰 생성 속도 350배 향상 |
극한의 추론 조건에서 대역폭 병목 현상을 해결하기 위해 NVIDIA는 인수한 Groq의 기술을 통합한 최종 솔루션인 비대칭적 분리 추론을 공개했다.
젠슨 황은 Dynamo 소프트웨어 시스템을 사용하여 추론 프로세스를 분해한다고 설명했다. 즉, 대규모 컴퓨팅과 메모리가 필요한 '프리필' 단계는 Vera Rubin이 담당하고, 지연 시간에 매우 민감한 '디코드' 단계는 Groq의 LPU가 담당한다. Groq 칩은 500MB의 SRAM을 탑재하여 매우 낮은 지연 시간으로 모델 가중치를 읽을 수 있어 토큰 생성을 느리게 하는 '메모리 월' 문제를 극복한다. 이 조합을 통해 기가와트 규모의 공장 내에서 토큰 생성 속도가 350배라는 놀라운 비약을 이룬다. 이와 비교하여 무어의 법칙은 같은 기간에 약 1.5배의 향상만을 가져올 뿐이다.
황 CEO는 기업을 위한 구성 조언도 제시했다. "만약 작업이 주로 높은 처리량(throughput)이라면 100% Vera Rubin을 사용하십시오. 고부가가치의 프로그래밍 수준 토큰 생성 수요가 많다면 데이터 센터 규모의 25%를 Groq에 할당하십시오."
기조연설에서 황 CEO는 더 장기적인 로드맵도 제시했다. Rubin Ultra는 새로운 'Kyber' 랙 아키텍처를 채택하여 144개의 GPU를 수직으로 통합하고 FP4 추론 컴퓨팅을 15 ExaFLOPS로 끌어올리며, 2027년 하반기에 양산 출하가 시작될 예정이다.
차세대 Feynman 아키텍처도 공개되었다. TSMC의 1.6나노 공정을 채택하고 'Rosa'라는 코드명의 새로운 CPU를 탑재하며, 맞춤형 HBM 기술과 공동 패키징 옵틱스 솔루션을 도입할 예정이다. 황 CEO는 Feynman 시대는 NVIDIA가 컴퓨팅, 메모리, 패키징을 깊이 결합시켜 데이터 센터를 고도로 통합된 '메가 슈퍼컴퓨터'로 진화시키는 시대라고 말했다.
기조연설 전체를 통틀어 소프트웨어 개발자에게 가장 깊은 영향을 미친 것은 오픈소스 프로젝트 OpenClaw에 대한 젠슨 황의 논평이었다. 그는 OpenClaw를 "인류 역사상 가장 인기 있는 오픈소스 프로젝트"라고 묘사하며, Linux가 30년 이상에 걸쳐 이룩한 성과를 불과 몇 주 만에 능가했다고 말했다.
"기술적 본질에서 OpenClaw는 에이전트 컴퓨터의 운영체제로 이해될 수 있습니다."라고 황 CEO는 말했다. 이는 대규모 언어 모델을 연결하고, 컴퓨팅 리소스를 관리하며, 파일 시스템에 접근하고, 복잡한 문제를 하위 에이전트에게 분해하여 협력적으로 해결하도록 할 수 있다.
황 CEO는 놀라운 단언을 했다. "모든 SaaS 기업은 사라질 것입니다." 에이전트 시대에 전통적인 엔터프라이즈 소프트웨어는 지능형 에이전트를 중심으로 한 서비스 플랫폼, 즉 AaaS로 전환될 것이다. 그는 오늘날 전 세계 모든 기업이 즉시 자체 OpenClaw 전략을 수립해야 한다고 경고했다.
이를 위해 NVIDIA는 엔터프라이즈급 보안 솔루션 NemoClaw를 발표했다. OpenShell 보안 레이어를 통해 네트워크 가드레일과 프라이버시 라우터를 제공하여 에이전트가 기업 네트워크 내에서 안전하게 작동하도록 보장한다.
AI는 스크린 밖으로 나와 물리적 세계와 상호작용하기 시작했다. 이번 GTC에서는 자율주행과 로봇 공학의 진전이 특히 주목할 만했다.
BYD, 지리 자동차, 현대자동차는 NVIDIA의 '로보택시 레디' 플랫폼에 참여한다고 발표했다. 이는 이들 브랜드가 자율주행 택시를 개발하기 위해 NVIDIA의 풀스택 솔루션을 채택할 것임을 의미한다. Uber도 내년부터 NVIDIA의 Drive AV 소프트웨어 기반 자율주행 차량 fleet 배치를 계획하고 있다.
기조연설의 하이라이트는 디즈니 로봇 '올라프' 의 놀라운 등장이었다. NVIDIA와 디즈니가 협력하여 개발한 이 로봇은 걷고, 손을 흔들며, 젠슨 황과 간단한 대화를 나눌 수 있어 물리적 세계에서의 유연한 상호작용 능력을 보여주었다. 그 이면에는 훈련에 사용되는 Isaac Sim 시뮬레이션 플랫폼부터 로봇 자체에 탑재되는 Jetson Thor 컴퓨팅 모듈에 이르기까지, 로봇 공학에 대한 NVIDIA의 장기적인 투자가 있다.
지상의 AI 공장이 충분히 인상적이었다면, NVIDIA가 발표한 Space-1 Vera Rubin 모듈은 AI의 영역을 우주로 확장시킨다.
이것은 우주의 극한 환경을 위해 설계된 AI 컴퓨팅 모듈이며, 방사능 내성 기능을 갖추고 있어 위성이나 우주 정거장에 탑재될 수 있다. 미래의 위성은 더 이상 단순한 '신호 중계소'가 아니라 궤도에서 작동하는 '지능형 노드'가 되어 촬영한 이미지를 실시간으로 처리하고 센서 데이터를 분석하며, 막대한 양의 원시 데이터를 지구로 전송할 필요가 없어진다. 황 CEO는 이것을 "우주에서 지상까지의 완전한 컴퓨팅 아키텍처를 구축하는" 첫걸음이라고 불렀다.
젠슨 황의 낙관적인 가이던스에 힘입어 NVIDIA의 주가는 장중 4.3% 이상 상승했다. 골드만삭스는 이 명확한 장기 수익 전망이 월가의 예상을 크게 상회하며 AI 자본 지출이 2026년에 정점에 도달할 수 있다는 투자자들의 우려를 직접적으로 완화시켰다는 보고서를 발표했다.
그러나 일부 분석가들은 시장의 기대치가 이미 높았으며 컨퍼런스가 NVIDIA 자체에 관한 새로운 정보를 제공한 것은 제한적이었다고 지적한다. NVIDIA의 주가수익비율이 향후 더욱 개선되려면 AI 애플리케이션의 더 빠른 채택 외에도 '물리적 AI'나 '우주 컴퓨팅'과 같은 새로운 성장 동력이 이를 견인해야 할 것이다.
젠슨 황이 그린 '토큰 공장' 시대가 가속화됨에 따라 기업들은 점점 더 심각한 도전에 직면하고 있다. 수천만 달러 규모의 Vera Rubin 슈퍼칩 클러스터는 모든 개발자나 중소기업이 쉽게 손에 넣을 수 있는 것이 아니다. 대기업 주도의 이러한 하드웨어 군비 경쟁의 틈바구니에서 어떻게 더 유연하고 비용 효율적인 방법으로 이 컴퓨팅 파워의 흐름에 접속할 수 있느냐가 무수한 AI 혁신가들이 '토큰 경제학'의 발맞춤을 따라잡을 수 있는지의 관건이 된다.
GTC에서 입증된 바와 같이, AI의 애플리케이션 시나리오는 전례 없이 다양화되고 있다. 복잡한 에이전트 추론 및 물리적 AI 시뮬레이션에서부터 전통적인 그래픽 렌더링 및 과학기술 계산에 이르기까지, 각각의 작업은 컴퓨팅 유형에 대해 서로 다른 요구 사항을 제기한다. 이러한 상황에서 Omniyq(www.omniyq.com)와 같은 전문 컴퓨팅 파워 임대 플랫폼은 최첨단 하드웨어와 폭넓은 애플리케이션을 연결하는 가교 역할을 하고 있다. 이 플랫폼은 비용 효율적인 추론 솔루션인 RTX 4090부터 대규모 훈련용으로 설계된 A100, H100, H200, B200, B300 등의 클러스터 인프라에 이르는 리소스를 집약하고 있다. 풍부한 GPU 컴퓨팅 리소스 풀과 높은 비용 대비 성능의 탄력적인 컴퓨팅 파워 임대 서비스를 활용하여 사용자에게 높은 선택의 자유도를 제공한다. 개발자들이 최신 AI 기술을 시험하고 대규모 추론 애플리케이션을 구축하는 진입 장벽을 효과적으로 낮춤으로써, 이러한 플랫폼은 더 많은 기업이 젠슨 황이 말하는 '1조 달러의 토큰 경제'를 가벼운 자산으로 받아들이고, 무거운 하드웨어 투자에 얽매이지 않고 AI 공장 시대에 자신의 가치 창출에 집중할 수 있도록 한다.