AI类 · 2026年3月26日 0

ARM的AI叙事:AGI路径与CPU复兴

在AI叙事中,GPU一度吞噬了一切,但那些曾被边缘化的角色,逐步重新成为瓶颈。正如黄仁勋反复强调的那样,CPU已经成为限制英伟达“AI工厂”吞吐token速度的关键所在。换句话说,它是系统性能的阿姆达尔定律(Amdahl’s law)极限所在。

现在,长期坚持身居幕后的Arm公司,终于也决定亲自下场。Arm推出的首款面向外部销售的数据中心CPU,命名为Arm AGI CPU,充分体现了其野心。AGI(通用人工智能)是整个AI行业的长期叙事制高点,智能体是“递归式”通往AGI的重要路径。而Arm AGI CPU正是面向高性能智能体AI系统而设计的。

它性能强劲、易于扩展,而且功耗低。在发布会上,公司高管直斥x86架构CPU是AGI路线的技术债务。

根据官方资料,这款CPU拥有136个Neoverse V3核心,最高主频可达3.7GHz,由两个Chiplet组合而成,采用台积电3纳米工艺。每个核心配备2MB的L2缓存,并共享128MB的系统级缓存(SLC),内存带宽825 GB/s,设计热功率(TDP)为300W。

它已经超过了英伟达目前主打的Grace CPU。后者基于ARM Neoverse V2核心,无论是主频、L2缓存、内存带宽都落后了不少。

Meta与OpenAI,这些原本围绕AI推理芯片构建体系的玩家,如今开始为CPU预留位置;叫板英伟达的芯片初创企业Cerebras,也是它的客户之一。它们现在就可以订购,年底实现量产;明年,就迭代到第二代;AGI CPU 3也已在规划中。

智能体式(Agentic)AI的兴起,为CPU带来了新的价值。ARM首席执行官Rene Haas在发布会上称,随着AI从现有工作负载,演进到智能体式工作模式,数据中心对CPU的需求可能增长四倍,相当于每GW算力的CPU核心数,从当前的3000万个跃升至1.2亿个。相比传统x86架构CPU,AGI CPU能省下高达100亿美元/GW的电费和资本支出。

随着GPU算力日益强大,其空闲或未充分利用的也越来越不可接受。AI工厂吞吐token的交互速度,如果从每秒400个token向1000个token延伸,那么,每百万token的价格可以从45美元提升至150美元,这不是线性的增长。

在GTC 2026期间,黄仁勋接受专访时称,英伟达专注于加速计算,目标从来不是取代CPU,而是最大化整个系统的性能。那些立错目标的竞争对手已经消失在历史里。在现代AI系统中,系统性能始终受阿姆达尔定律制约,GPU、网络、内存和CPU都会成为潜在瓶颈,英伟达正在一手抓。

随着智能体能力不断提升,它可以完成越来越多复杂任务,也将触及更多无法并行的工作负荷。一旦CPU性能不足,这部分“不可加速”的工作,就会成为整个系统的瓶颈。要求CPU确保数据、任务和工具调用能够高效流动,也就需要更强大的单核性能与IO能力。

智能体正在改变AI叙事的竞争格局。ARM AGI CPU就是CPU复兴最直接的一击。

来源:虎嗅