黄仁勋又站上了圣何塞SAP中心的舞台。这一次的GTC keynote,他用了将近两个小时,把英伟达的野心从芯片一路铺到外太空。
表面上看,这是一场产品发布会。Vera Rubin平台正式亮相,七颗芯片全部投产;收购Groq,其产品首次以”Groq 3 LPX”的身份嵌入英伟达的推理体系;自研CPU Vera问世,专为agent而设计;发布DLSS 5,把神经渲染带进游戏画面;基于爆火的OpenClaw,推出了英伟达自家的NemoClaw;拉来Mistral、Perplexity、Cursor等众AI公司,组建Nemotron开源模型联盟;自动驾驶方面,比亚迪、吉利、日产、五十铃接入英伟达的DRIVE Hyperion平台,Uber宣布2028年前在28个城市部署英伟达全栈自动驾驶车队;机器人基础模型GR00T N2亮相;甚至还有太空计划,英伟达也要把算力送上轨道。
但黄仁勋真正想传达的信息,比任何一款产品都大。他给出了一个数字:从2025年到2027年,AI芯片的营收将要超过1万亿美元。黄仁勋说,在AI时代,token是新的货币,AI工厂是生产它们的基础设施。
Vera Rubin平台
Vera Rubin是这场发布会的核心硬件。它由七颗芯片组成:Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片,以及新整合的Groq 3 LPU。
这七颗芯片全部投产,设计目标是组成一台协同工作的超级计算机,从大规模预训练、后训练、测试时推理扩展,到实时的agent推理,这一台机器就可以覆盖AI的所有流程。
核心产品是Vera Rubin NVL72机架,集成72颗Rubin GPU和36颗Vera CPU,通过NVLink 6互联。黄仁勋称,相比上一代Blackwell平台,NVL72训练大型混合专家模型所需的GPU数量减少到四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。
Groq LPU 登场
训练是英伟达发家之本,但推理才是接下来真正的战场。因为训练只是一次性的重活,推理才是永不停歇的日常。
黄仁勋提出的方案是把推理拆成两个阶段,分别用不同的芯片来处理。大语言模型的推理分为两步:prefill和decode。prefill阶段处理你输入的提示词,属于计算密集型任务,GPU擅长这个;decode阶段则是逐个生成回答的token,属于带宽密集型任务,需要极高的内存读取速度。
Groq 3 LPU就是为decode阶段而生的。LPU全称Language Processing Unit,由Groq公司开发。这家公司由前谷歌TPU团队成员创立,英伟达在2025年底以200亿美元收购了其核心资产。每颗Groq 3 LPU内置了500MB的SRAM,带宽达到150TB/s,是Rubin GPU中HBM带宽的近7倍。
NemoClaw
黄仁勋在台上直接点名了Claude Code和OpenClaw,他说Claude Code和OpenClaw引起了agent的拐点。黄仁勋夸赞OpenClaw,称OpenClaw向所有人打开了AI的下一个前沿,成为历史上增长最快的开源项目。”Mac和Windows是个人电脑的操作系统,OpenClaw是个人AI的操作系统。这是整个行业一直在等待的时刻。”
英伟达为OpenClaw推出了NemoClaw。NemoClaw是通过NVIDIA Agent Toolkit优化过后的OpenClaw,一条命令即可完成安装。它的核心组件是OpenShell,这是一个提供开源模型和隔离沙箱的环境,为agent加上基于策略的安全、网络和隐私护栏。
自动驾驶
自动驾驶是英伟达近几年的重点之一。比亚迪、吉利、日产、五十铃宣布采用英伟达DRIVE Hyperion平台开发L4级自动驾驶车辆。Uber宣布与英伟达扩大合作,计划到2028年在28个城市、四个大陆部署全栈英伟达自动驾驶软件驱动的自动驾驶车队,首批城市是洛杉矶和旧金山湾区,2027年上半年启动。
太空计算:最后的边疆
最后,英伟达也宣布进军太空计算。黄仁勋说,太空计算是最后的边疆,现如今已经到来。
于是黄仁勋拿出了Space-1 Vera Rubin Module,这是一个面向轨道数据中心的计算模块。黄仁勋称,相比H100,Space-1在太空推理场景下提供25倍的AI算力提升,能够在轨道上直接运行大语言模型和高级基础模型,处理来自太空仪器的海量实时数据流。
来源:虎嗅

