英伟达GTC 2026大会上,CEO黄仁勋预测Blackwell与Vera Rubin平台到2027年底将创造至少1万亿美元收入,较去年预测翻倍,大幅超出华尔街预期并推动股价上涨。
英伟达发布Vera Rubin平台,由Vera CPU、Rubin GPU及Groq 3 LPU等七款芯片和五种机架系统组成,采用台积电3nm工艺,面向代理式AI打造完整超级计算机。
新一代Vera Rubin平台在FP8精度下推理算力达到16 PetaFLOPS,较H100提升8倍,黄仁勋提出“Token工厂经济学”,强调推理Token成本已降至GPT-4时代的十分之一以下。
英伟达推出Groq 3 LPU,专为大模型低延迟推理优化,集成大容量SRAM,Token吞吐量可达每秒1500个,以支持复杂的多智能体系统交互。
英伟达发布Quantum3400 CPO交换机,传输损耗降低60%,能效提升5倍;下一代高密度算力集群单机柜功耗升至240-260kW,全液冷成为标配散热方案。
云服务商Akamai采购数千块英伟达Blackwell GPU,用于打造全球分布式AI推理平台,将算力部署在边缘侧以降低延迟和出口费用。
摩尔线程、沐曦股份等国产GPU厂商近期登陆资本市场,行业进入资本化加速期,但部分智算中心国产芯片利用率不足50%,产业正从“拼参数”转向“拼易用性和全栈解决方案”。
中美算力路径分化:美国侧重于前沿技术突破如3nm及1.6nm工艺、太空算力;中国更注重算力与实体经济融合,实施“算电协同”战略,利用西部绿电解决东部智能算力供需错配。
英伟达携手比亚迪、吉利等车企,基于DRIVE Hyperion平台开发L4级自动驾驶汽车;同时正在研发部署在太空的数据中心计算机,支持航天器实时感知与自主决策。
随着开源项目OpenClaw的走热,英伟达推出NemoClaw平台帮助企业安全部署智能体,AI生态转向“智能体即服务”,行业内Token逐渐成为新的衡量单位。