AI类 · 2026年3月18日 0

GPU撑不起万亿野心,英伟达正在”格式化”数据中心

根据3月16日《华尔街日报》的内部爆料,OpenAI已经开启一项重大的战略转型:削减公司”全面开花”的各项副业,将公司发展重心重新聚焦至代码开发与商业用户领域。

在内部的大会上,OpenAI的应用业务CEO菲吉・西莫(Fidji Simo)向员工宣布公司高层正在加紧梳理一些将要降低优先级或暂缓推进的板块,并将在未来几周内公布具体调整计划。

“我们绝不能因旁枝末节的业务分心,错失当下的发展机遇。我们必须全力做好通用生产力领域的布局,尤其要深耕商业端的生产力赛道”,菲吉・西莫这样对员工解释这次调整。

身穿标志性黑色皮衣,英伟达首席执行官黄仁勋再次站在美国加州圣何塞SAP中心,这一次他要讲的是,对这家公司来说GPU不再是唯一主角。

北京时间3月17日凌晨2时,年度开发者大会GTC2026首日主题演讲环节,黄仁勋用了两个多小时时间向外界回答,英伟达如何在人工智能巨变中生存下去,并保持领先地位。

他预计,到2027年底,其Blackwell和Rubin芯片将至少创造1万亿美元收入。在此之前,该公司曾预计,到2026年底,这些芯片带来的收入是5000亿美元。也就是说,这个展望不仅向后延长了一年,总量也翻了一倍。

受此消息影响,该公司收盘时涨幅为1.65%。这只是当天发布众多消息的冰山一角。

1993年创立的英伟达曾长期偏安于GPU市场,这种平庸一直持续到黄仁勋决定每年豪掷5亿美元“梭哈”CUDA架构。这笔钱相当于当时公司总营收的六分之一。随后,英伟达通过游说高校、赞助研究所以及向大厂科学家赠送测试卡,在硅谷工程师中催生出一套新的生态。

2012年,当深度神经网络撞上CPU的算力天花板,早已卡位成功的英伟达瞬间完成了从“游戏配件商”到“AI基座”的权力交接,开启了随后业绩和股价一路狂奔。截至上述收盘时,英伟达市值已达44522亿美元,为全球市值最高的公司,超过第二名苹果近1万亿美元。

主题演讲的开端是一段长达十分钟对CUDA架构诞生20周年的回顾,黄仁勋将其定义为英伟达一切业务的“中心”。他用一张图阐述了CUDA的飞轮效应,而其中最难实现的安装基数,如今已在全球建立起规模过亿级的计算系统,遍布各大云厂商和计算机公司的产品和服务。

但这些都只是过去,拐点已至。黄仁勋向外界展示了为Agentic AI打造的Vera Rubin平台,并宣布七款新芯片全面投产,由这些芯片协同工作将构成一台强大的AI超级计算机,从大模型预训练、后训练和测试时扩展,到实时智能推理,为AI的各个阶段提供支持。

尽管采用3纳米制程的Rubin GPU性能相比上一代也有大幅提升,但外界更加关注CPU的细节。这款CPU芯片的效率是传统机架式CPU的两倍,速度提升50%,并且采用了LPDDR5X内存,拥有最高的单线程性能和单核带宽。

黄仁勋展示英伟达成立以来最有野心的产品组合。图片来源:视觉中国

黄仁勋称,这款CPU独立售卖的话,将会成为一个价值数十亿美元的业务。英伟达发布的新闻稿显示,阿里巴巴、CoreWeave、Meta和甲骨文等云服务商,以及戴尔、惠普、联想和超威等全球系统制造商将与英伟达合作部署该芯片。

第七颗芯片Groq 3 LPU更是重头戏。2025年12月,英伟达通过技术授权协议获得的Groq的技术和团队核心成员,而仅过去数个月,产品首次落地并已开始量产。对于其价值,黄仁勋的答案是,解决GPU在超高速Token生成的短板。

英伟达通过软件Dynamo把推理过程分成两个部分,Vera Rubin解决前半段的预填充(prefill)和注意力机制(attention),后半段的解码(decode)和Token生成则交由Groq负责。黄仁勋称其为“Disaggregated Inference”(解耦推理),解决高吞吐和低延迟的物理矛盾。

至于能否成为黄仁勋所说的“致胜秘诀”,仍需要交给时间去检验。身处大会现场的Forrester副总裁、首席分析师戴鲲告诉虎嗅,英伟达在CPU和LPU的布局并非简单扩展产品线,而是将竞争从单芯片性能上移到系统架构层面,客观上已正面进入AMD与英特尔在数据中心 CPU与异构系统层的主战场。

英伟达要为Agent补短板,推向企业级。图片来源:英伟达官网

在一些秀肌肉动作之后,黄仁勋再度炸场,“如今世界上的每一家公司都需要制定Agent战略。这就是新一代计算机”,甚至他将Agent视为个人人工智能的操作系统,而每一家SaaS公司也将变成AgaaS公司。

黄仁勋用操作系统的视角解读了Agent的本质。事实上,Agent仅上线数周,却已超过了Linux三十年累积的下载量,并在GitHub星标数已突破25万,成为增长最快的开源项目。但他也指出了Agent在企业场景存在致命的安全问题。

英伟达与Agent的开发者Peter Steinberger合作推出了Nemo Agent软件工具包。通过安装OpenShell,提供缺失的基础架构,通过沙箱、隐私和安全护栏,使其拥有高效运行所需的访问权,同时强制执行基于策略的安全、网络和隐私防护措施。黄仁勋称,其现在已具备企业级应用的条件了。

戴鲲表示,对英伟达而言,Agentic AI时代,借助这一轮Agent的全球热潮,抢占Runtime和操作系统级的关键标准位置。通过降低Agent部署门槛并推动其全天候运行,Nemo Agent将直接放大推理负载和算力消耗,从而反向强化GPU、CPU和LPU的长期需求,延续英伟达一贯的平台驱动算力的战略逻辑。

热度之外,英伟达并没有忘记最初的原点。黄仁勋称,GeForce就是用来吸引未来用户的,在他们还买不起企业级产品时,游戏显卡是主要面向其销售的产品。

在主题演讲的开端,英伟达展示了一组最新产品改变游戏渲染的对比。其发布了DLSS 5,这是该公司自2018年推出实时光线追踪技术以来在计算机图形领域取得的最重大的突破。

根据官方说法,DLSS 5 引入了一种实时神经渲染模型,能够为像素注入逼真的光照和材质效果。DLSS 5缩减了渲染与现实之间的鸿沟,使游戏开发者能够打造出前所未有的逼真计算机图形,而这种效果以往只有在好莱坞视觉特效领域才能实现。

此外,在这场主题演讲中,黄仁勋还透露一系列新的变化:下一代计算架构Feynman取得核心突破,将联合开发部署在太空的数据中心计算机,自动驾驶平台新增比亚迪、吉利、五十铃、日产等L4级自动驾驶汽车伙伴,以及与ABB、Universal Robots、库卡等企业在工业机器人领域的合作。

演讲尾声,由英伟达、DeepMind和迪士尼合作设计的动画系列《冰雪奇缘》中雪宝机器人版本蹒跚地上舞台,和黄仁勋就英伟达旗下Omniverse部门展开了一段对话。这三家公司联合研发了一套物理仿真系统。黄仁勋说,未来迪士尼乐园所有角色都将拥有真正的智能,与游客展开真实的互动。

就像黄仁勋那件从不更换的黑色皮衣一样,英伟达现在的商业逻辑非常简单且确定,就是在绝对的算力与生态封锁面前,所有的后来者都只能在英伟达的阴影里缓慢前行。

来源:虎嗅网