-

全球GPU算力资讯简要【20260308】

2026-03-08
  1. 英伟达计划推出专用推理芯片:据透露,英伟达正在设计一套专注于“推理”计算的新系统,旨在更高效地支持AI模型的响应查询。该系统预计将在本月GTC大会上亮相,并整合了初创公司格罗克公司的LPU(语言处理单元)技术,OpenAI将成为其最大客户之一。

  2. 国产GPU厂商业绩快报亮眼:摩尔线程与沐曦股份双双发布2025年业绩快报,营收均实现翻倍以上增长。摩尔线程营收突破15.05亿元,同比增长243.37%;沐曦股份营收达16.44亿元,同比增长121.26%,亏损也显著收窄,显示出国产AI芯片的商业化进程正在加速。

  3. GTC大会前瞻聚焦算力基建升级:随着英伟达GTC大会临近,市场焦点已从单一芯片转向电源架构、光通信和液冷散热等基础设施领域。为了支撑功耗高达数千瓦的新一代GPU,800V高压供电、CPO(共封装光学)交换机及全液冷方案预计将成为大会的技术亮点。

  4. 高端GPU算力租赁价格暴涨:由于AI推理需求激增与供给紧张,2026年开年英伟达高端GPU租赁价格进入上涨周期。截至2月底,H200型号月租金已涨至6.0-6.6万元,环比涨幅高达25%-30%,H100涨幅也达15%-20%,订单排期已延长至2027年。

  5. Token消耗量指数级攀升:AI应用从“问答工具”向“生产力工具”转变,推动Token消耗量激增。MiniMax数据显示,其模型日均Token消耗量较去年12月增长超6倍,其中编程场景增长超十倍。这种推理算力的持续性消耗,为算力芯片产业带来了价值重估的机会。

  6. 沐曦股份发布Q1业绩预告,亏损收窄:沐曦股份披露2026年第一季度业绩预告,预计实现营收4亿至6亿元,同比增长24.84%至87.26%;归母净利润亏损同比大幅收窄21.93%至60.97%。业绩利好推动其股价单日上涨5.66%,显示出市场对国产GPU盈利拐点的强烈预期。

  7. 并行科技拟斥资超8000万元采购算力设备:为满足业务发展需求,并行科技公告拟向供应商采购GPU算力服务器和存储设备,预计总额不超过8066万元。其中GPU算力服务器采购金额不超过2736万元,相关议案已获董事会审议通过。

  8. 中国模型Token调用量首超美国:全球AI模型API聚合平台OpenRouter数据显示,在2月9日至15日的一周内,中国模型的Token调用量达4.12万亿,首次超过美国模型的2.94万亿。这一数据反映出国内AI应用需求的爆发,也直接推高了对底层国产算力的需求。

  9. 国产GPU性能逼近国际主流:国产芯片在算力密度上取得突破。摩尔线程S5000单卡FP8算力已突破1000TFLOPS,训练精度与英伟达H100差距不到1%。同时,华为预计在今年一季度发布昇腾950PR,算力同样达到1PFLOPS(FP8),国产芯片正从“技术可用”迈向“规模可用”。

  10. 国产GPU加速生态适配与商业化落地:面对英伟达CUDA生态的壁垒,国产厂商正通过不同路径突围。沐曦通过开源MXMACA策略吸引开发者,其C500/C550系列已逐步适配腾讯混元、智谱GLM-5等多家国产大模型;摩尔线程则坚持自研MUSA架构,在保持兼容性的同时培育原生生态。


分享