AI类 · 2026年3月23日 0

英伟达正在封装世界

刚结束的GTC上,英伟达传递出的一个关键信号是,其在不断深化芯片提供商向AI基础设施系统提供商的角色转变。

“英伟达正在封装AI算力层面的基础设施。”韦豪创芯创始合伙人王智表示,程序编写的方式从与硬件高度耦合的机器语言到汇编语言、到接近自然语言的高级程序语言、再到Windows的GUI、进一步出现面向对象的编程……直到用Python这样主要引用“库”的“胶水语言”,软件世界经历了一个不断将逻辑和功能高度抽象化和封装的过程,而英伟达正在AI算力基础设施世界展示同样的故事。

王智解释,这种高度封装的好处是,客户规避了对复杂系统中基础组件的“手搓”式采购和测试,而是可以搭积木,以乐高的方式搭建。英伟达在将这种封装不断扩散。

token正在变成大宗商品。

这是黄仁勋在演讲中抛出的核心观点。封装的终点,是让复杂的东西消失在视野之外。当芯片、系统、调度软件被一层层封装起来,用户感知不到GPU,感知不到算力,感知到的只剩一个单位:token。token是封装完成之后,唯一暴露在外的接口。它变成大宗商品,是封装的必然结果,不是偶然。

黄仁勋在演讲中明确说了这句话:“Tokens are the new commodity”(Token是新的大宗商品)。大宗商品成熟之后会自然分层。他不是在描述现状,他是在预判一个市场结构,然后把英伟达的硬件产品线,精确地铺在这个结构的每一层上。

GTC 2026上,英伟达推出了五层Token定价体系:免费层、中级层、高级层、高速层和超高速层,对应不同的token量。这正如当年电信行业基本没干成的理想,也就是对数据流量进行差异化定价。背后是一个更深层的趋势:算力需求的精细化。

英伟达在建立一个比CUDA更大的帝国

封装意味着绑定。从GPU到系统,从系统到token经济规则,英伟达每封装一层,外部的替代成本就高一个量级,这也是英伟达为何要把封装不断加深的原因——你会越来越讨厌他,但你会越来越离不开他。

过去几年,这套封装在训练侧的护城河是CUDA。但在推理侧,CUDA的优势从来没有那么明显。训练是计算密集型,HBM(高带宽内存)是最优解;推理是存储密集型,需要的是低延时、大容量的快速存储。

英伟达宣布了和芯片厂商Groq的整合,同时发布了新的CPU,这款CPU专门为算力中心优化设计。显然,英伟达正在构筑一个比CUDA更大的帝国。

创业公司的机会还有吗

关键在于,英伟达不会做所有的事,它的强项是系统级、规模化的交付,是面向数据中心的整体解决方案。而边缘场景和中等定制化场景的特点恰恰相反:和特定场景高度绑定,需要定制化能力。

这里就是可重构计算的机会所在。可重构计算解决的是一个根本矛盾:通用芯片效率低,专用芯片太死板。这也是中国半导体领域少数几个与国际差距相对较小的方向之一。

来源:虎嗅网