3月18日,阿里云和百度智能云同日宣布AI算力和存储产品涨价,涨幅最高达34%。一周前,腾讯云刚刚将混元大模型Token价格上调超450%。
中国四大云厂商中的三家,不到十天内集体涨价。而涨价,曾经是云计算行业字典里不存在的词汇。
作为行业领军者,亚马逊AWS用二十年间近百次的降价奠定了整个产业”只降不涨”的历史基调。贝佐斯那句”降价是我们的核心策略”,让微软Azure与谷歌云不得不长期祭出激进的降价打法被动迎战。
传导至国内,价格战演绎得更为惨烈。从早年震惊业界的”一分钱中标”,一年18轮降价的疯狂,再到动辄腰斩乃至降价90%的”基操”,直至近期大模型战场上从”以分计价”迅速跌至免费的新一轮厮杀,降价早已融入了云厂商的血液。
为什么是现在?
某家头部云厂商负责人对观察者网表示:”供应链是这轮涨价的核心原因。成本涨到这个程度,行业内谁都不可能再亏损换客户了。”
最直观的压力来自GPU。截至2月底,英伟达H200、H100等高端GPU租金环比上涨15%~30%。
这背后是核心存储组件对整个算力硬件的成本倒逼。全球95%的HBM产能被三星、SK海力士、美光三家垄断,行业普遍认为这一短缺可能持续至2028年,成为AI行业结构性约束。
这也直接导致2026年Q1传统DRAM合约价格环比暴涨约90%~95%,DDR5内存芯片现货价格半年最高涨近6倍,服务器级合约价单季翻倍。
与此同时,物理基础设施的成本同样在失控。智算中心单机柜功耗从传统数据中心的5kW飙升至120kW以上,数据中心电力及散热成本占运营总成本的比例已高达40%~60%。
AI需求爆发
但单纯的成本压力并不足以支撑全行业的集体提价,真正的驱动力来自需求端的爆发与结构性转变。
2025年上半年中国公有云上大模型调用量达536.7万亿Tokens,较2024年全年增长近400%。到2026年2月,中国日均Token消耗已到180万亿级别。3月9日至15日这一周,中国AI大模型周调用量更是首次超过美国。
更关键的是需求结构的变化:AI应用大规模落地后,推理需求占总算力需求首次突破70%,取代训练成为算力消耗的第一驱动力。

