AI类 · 2026年3月23日 0

中国AI模型周调用量达4.69万亿Token 超越美国 算力紧张问题凸显

3月15日,全球最大AI模型聚合平台OpenRouter发布了一组数据,中国大模型在这一周的调用量达到4.69万亿Token,连续第二周压过美国,全球调用量排名前三的位置被中国模型包揽。

同一时期,月之暗面公司的Kimi正经历一场从资本到市场的连环爆发。

据证券时报报道,2025年12月底至今,Kimi完成三轮融资,估值在不到三个月内翻了四倍,升至180亿美元,成为国内估值最快突破百亿美元的”十角兽”公司。

新一轮10亿美元融资正在进行。

受Kimi K2.5模型及Kimi Claw火爆出圈带动,1月底以来,Kimi20天收入超过2025年全年。

全球支付巨头Stripe的数据显示,Kimi个人订阅用户1月支付订单数环比增长8280%,2月环比再涨123.8%,冲进Stripe全球榜单前十。

算力紧张背后的供需矛盾

我使用Kimi查资料时,最常遇到的就是那句”高峰时段算力不足”。起初以为只是个别产品的运营波动,直到看到4.69万亿Token这个数字,才意识到那句提示语背后站着的不是某个公司的服务器告急,而是整个行业的供需方程式正在被改写。

AI智能体是需求爆炸的直接推手

以OpenClaw为代表的智能体框架,把大模型从回答问题的工具变成了自动执行任务的数字员工。一个配置合理的智能体可以全天候工作,消耗的Token是普通聊天的几十倍甚至上百倍。

Kimi K2.5恰好成为开源智能体框架OpenClaw的首选模型,海外开发者的调用量因此激增,直接加剧了算力紧张。

摩根大通预测

摩根大通预测,中国的AI推理Token消耗量将从2025年的约10千万亿增长到2030年的约3900千万亿,五年增长约370倍。数字所指向的,正是眼下发生的智能体浪潮。

供给侧的物理极限

高性能芯片获取难、成本高,在当前国际环境下,即便Kimi资金充裕,也难以在短时间内获得足够的高性能计算芯片来满足暴涨的需求。

2026年3月,阿里云、百度智能云、腾讯云相继宣布上调AI算力产品价格或调整Token计费标准,算力成本压力已经传导到终端。

算力效率成为新的制高点

过去几年,中美AI竞赛的核心指标是模型参数量、上下文长度、多模态能力。现在,算力效率正在成为新的制高点

美国企业凭借高端芯片的供给优势,长期沿用大力出奇迹的路径,用更强的单卡性能掩盖架构上的粗放。

中国企业则在芯片供应受限的硬约束下,被迫在架构创新、推理优化、系统调度上走得更深。

来源:虎嗅