Token吞金兽发力，BAT做出了”违背祖训”的决定

3月18日，阿里云和百度智能云同日宣布AI算力和存储产品涨价，涨幅最高达34%。一周前，腾讯云刚刚将混元大模型Token价格上调超450%。

中国四大云厂商中的三家，不到十天内集体涨价。而涨价，曾经是云计算行业字典里不存在的词汇。

作为行业领军者，亚马逊AWS用二十年间近百次的降价奠定了整个产业”只降不涨”的历史基调。贝佐斯那句”降价是我们的核心策略”，让微软Azure与谷歌云不得不长期祭出激进的降价打法被动迎战。

传导至国内，价格战演绎得更为惨烈。从早年震惊业界的”一分钱中标”，一年18轮降价的疯狂，再到动辄腰斩乃至降价90%的”基操”，直至近期大模型战场上从”以分计价”迅速跌至免费的新一轮厮杀，降价早已融入了云厂商的血液。

为什么是现在？

某家头部云厂商负责人对观察者网表示：”供应链是这轮涨价的核心原因。成本涨到这个程度，行业内谁都不可能再亏损换客户了。”

最直观的压力来自GPU。截至2月底，英伟达H200、H100等高端GPU租金环比上涨15%~30%。

这背后是核心存储组件对整个算力硬件的成本倒逼。全球95%的HBM产能被三星、SK海力士、美光三家垄断，行业普遍认为这一短缺可能持续至2028年，成为AI行业结构性约束。

这也直接导致2026年Q1传统DRAM合约价格环比暴涨约90%~95%，DDR5内存芯片现货价格半年最高涨近6倍，服务器级合约价单季翻倍。

与此同时，物理基础设施的成本同样在失控。智算中心单机柜功耗从传统数据中心的5kW飙升至120kW以上，数据中心电力及散热成本占运营总成本的比例已高达40%~60%。

但单纯的成本压力并不足以支撑全行业的集体提价，真正的驱动力来自需求端的爆发与结构性转变。

2025年上半年中国公有云上大模型调用量达536.7万亿Tokens，较2024年全年增长近400%。到2026年2月，中国日均Token消耗已到180万亿级别。3月9日至15日这一周，中国AI大模型周调用量更是首次超过美国。

更关键的是需求结构的变化：AI应用大规模落地后，推理需求占总算力需求首次突破70%，取代训练成为算力消耗的第一驱动力。