-

GTC 2026直击:黄仁勋的万亿美元Token狂想

2026-03-17

美国加州圣何塞当地时间3月17日,当NVIDIA创始人兼首席执行官黄仁勋身着标志性皮衣出现在SAP中心的聚光灯下时,他手中不再仅仅举着一块新的芯片,而是展开了一张覆盖从地面数据中心到太空轨道的宏伟版图。2026年的GTC大会不仅是一场硬件发布会,更是一次关于“AI经济学”的重新定价。 黄仁勋向世界抛出了一个核心论断:Token(词元)是新的货币,而AI工厂是生产它的基础设施。

万亿美元赌注:从芯片公司到“Token工厂”的蜕变

黄仁勋在演讲开场就抛出一个惊人预测:到2027年,市场对Blackwell和Vera Rubin系统的订单需求将带来至少1万亿美元的营收,这个数字较去年的预测直接翻了一番。他指出,AI正在从“模型训练时代”加速迈入“模型推理时代”——过去人们关注训练模型需要多少算力,而现在当模型被部署到实际应用中,每一次对话、每一张图片生成都需要消耗大量推理算力。

“每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座1GW的工厂永远不会变成2GW,这是物理和原子的定律。”黄仁勋首次系统阐述了 “Token工厂经济学”:在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低。他甚至将未来的AI服务划分为从免费层到超高速层的五个商业层级,认为企业的竞争力将直接取决于生产这些智能Token的成本与效率。

Vera Rubin宇宙:七芯协同的算力核弹

本次GTC最重磅的发布莫过于新一代AI平台 “Vera Rubin” 。这不再是一颗简单的GPU,而是一个由七款芯片组成的庞大系统,涵盖计算、网络和存储,旨在组成一台协同工作的超级计算机。

其中,全新自研的Vera CPU成为了焦点。这款拥有88个自研Olympus核心的数据中心处理器,是全球首款专为智能体AI和强化学习定制的CPU。它采用LPDDR5X内存,带宽高达1.2TB/s,能效比翻倍,黄仁勋强调其“单线程性能及能效是无与伦比的”。Vera CPU通过NVLink-C2C技术与Rubin GPU互联,提供高达1.8TB/s的一致性带宽,成为驱动AI“思考”的核心。

Rubin GPU同样令人震撼:采用台积电3纳米工艺制造,集成3360亿个晶体管,搭载288GB HBM4内存,内存带宽达22TB/秒。其推断算力以FP4精度计算高达50 PFLOPS,是Blackwell的5倍;训练算力35 PFLOPS,超出Blackwell 3.5倍。整个Vera Rubin NVL72机架配备260TB/秒的NVLink 6带宽——据英伟达称,这已超过整个互联网的带宽总量。

芯片/平台核心参数性能提升
Vera CPU88核ARM,LPDDR5X内存,1.2TB/s带宽效率是传统CPU的2倍
Rubin GPU3nm工艺,3360亿晶体管,288GB HBM4FP4推理算力达50 PFLOPS,为Blackwell的5倍
Vera Rubin NVL7272颗Rubin GPU + 36颗Vera CPUToken生成速率实现350倍增长

解耦推理:Groq LPU带来的35倍速度飞跃

为了解决极速推理条件下的带宽瓶颈,英伟达给出了整合被收购公司Groq的最终方案:非对称式的分离推理

黄仁勋解释,通过Dynamo软件系统,他们将推理过程分解:需要海量计算和显存的“预填充”阶段交给Vera Rubin,而对延迟极度敏感的“解码”阶段则交给Groq的LPU。Groq芯片拥有500MB SRAM,能以极低延迟读取模型权重参数,从而解决推理“吐字慢”的内存墙问题。这种组合在吉瓦级工厂中实现了Token生成速度350倍的惊人跨越,相比之下摩尔定律在同时期仅能带来约1.5倍的提升。

黄仁勋甚至给出了企业算力配置建议:“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高价值的编程级别的Token生成需求,拿出25%的数据中心规模给Groq。”

Rubin Ultra与Feynman:未来已来

在演讲中,黄仁勋还展示了更远期的路线图。Rubin Ultra将采用全新的Kyber机架架构,以竖向排列方式集成144颗GPU,FP4推断算力跃升至15 ExaFLOPS,预计2027年下半年量产交付。

下一代Feynman架构同样揭开面纱:将采用台积电1.6nm制程,搭载代号为Rosa的全新CPU,并引入定制化HBM技术和共封装光学方案。黄仁勋表示,Feynman时代标志着英伟达将计算、存储和封装进行深度耦合,将数据中心演进为一台高度集成的“巨型超级计算机”。

OpenClaw:智能体时代的操作系统,终结SaaS

整场演讲中对软件开发者影响最深远的,是黄仁勋对开源项目OpenClaw的评论。他将OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了Linux过去30年取得的成就。

“从技术本质上看,OpenClaw可以被理解为一种智能体计算机的操作系统。”黄仁勋说。它能够连接大语言模型,管理计算资源,调用文件系统,并将复杂问题拆解给子智能体协同完成任务。

黄仁勋做出惊人断言:“所有SaaS公司都将消失。” 在智能体时代,传统企业软件将转向以智能体为核心的服务平台,即AaaS(智能体即服务)。他警告,今天世界上的每一家公司都需要立即制定自己的OpenClaw战略。

为此,英伟达推出企业级安全解决方案NemoClaw,通过OpenShell安全层提供网络护栏和隐私路由器,确保智能体在企业网络中安全运行。

物理AI:从自动驾驶到迪士尼雪宝

AI正在走出屏幕,开始与物理世界互动。本次GTC,自动驾驶和机器人领域的进展尤为引人注目。

比亚迪、吉利、现代汽车宣布加入英伟达“robotaxi ready”平台,意味着这些品牌将采用英伟达全栈解决方案开发自动驾驶出租车。Uber也计划从明年起部署基于英伟达Drive AV软件的自动驾驶车队。

演讲高潮部分是迪士尼机器人“雪宝”(Olaf)的惊艳亮相。这个由英伟达与迪士尼合作开发的机器人能够行走、挥手,并与黄仁勋进行简单对话互动,展示了其在物理世界中的灵活交互能力。这背后是英伟达在机器人领域的长期投入:从用于训练的Isaac Sim仿真平台,到部署在机器人身上的Jetson Thor计算模块。

太空算力:AI的触角伸向宇宙

如果说地面上的AI工厂已经足够震撼,那么英伟达发布的Space-1 Vera Rubin模块,则将AI的疆域拓展到了太空。

这是一个为极端太空环境设计的、具备抗辐射能力的AI计算模块,可以部署在卫星或空间站上。未来的卫星将不再仅仅是“信号中继站”,而可以成为在轨运行的“智能节点”,实时处理拍摄的图像、分析传感器数据,无需将海量原始数据传回地面。黄仁勋将其称为“构建从太空到地面的完整算力架构”的第一步。

市场反应与未来挑战

受黄仁勋乐观指引提振,英伟达股价在盘中一度上涨超4.3%。高盛发布研报表示,这一明确的长期收入可见度大幅超出了华尔街预期,直接缓解了投资者对AI资本支出可能在2026年触及顶峰的担忧。

然而也有分析指出,市场预期早已拉高,大会对英伟达自身的增量信息有限。未来英伟达市盈率的再次提升,除了AI应用更快落地外,还需要“物理AI”、“太空算力”等新的成长曲线来拉动。

算力民主化:迎接Token经济时代的基建红利

随着黄仁勋描绘的“Token工厂”时代加速到来,企业面临的挑战日益严峻:动辄千万级别的Vera Rubin超级芯片集群并非所有开发者或中小企业都能轻易承担。在这场由大厂主导的硬件军备竞赛之外,如何以更灵活、更具性价比的方式接入这股算力洪流,成为了决定无数AI创新者能否跟上“Token经济学”步伐的关键。

正如GTC大会所展示的,AI应用场景正变得前所未有的多元——从复杂的智能体推理、物理AI仿真到传统的图形渲染与科学计算,每一种任务都对算力类型提出了差异化需求。在此背景下,像云擎天下www.omniyq.com这样的专业算力租赁平台正在成为连接前沿硬件与广泛应用的桥梁。该平台汇聚了从面向高性价比推理的RTX 4090,到专为大规模训练设计的A100、H100、H200、B200、B300等集群基础设施,凭借丰富的显卡算力资源池和高性价比的弹性算力租赁服务,为用户提供了极高的选择自由度。通过有效降低开发者尝试最新AI技术、构建大规模推理应用的门槛,这类平台让更多企业能够轻资产地拥抱黄仁勋所说的“万亿美元Token经济”,在AI工厂时代专注于创造属于自己的价值,而不必受困于重资产的硬件投入。

分享