全球AI大模型Token调用量逆转，算力涨价潮下谁将胜出？

2026-04-21 04:05:54未知作者:徽声在线

每经特约记者：林晓晨每经编辑：陈峰

在经历连续十周的攀升后，全球AI大模型的Token（词元）调用量突然出现转折，呈现出连续两周下滑的态势。

据徽声在线从OpenRouter（当前全球规模最大的AI模型API聚合平台，拥有超过500万开发者用户，其API调用量数据被视为AI应用普及的“风向标”）获取的最新数据推算，上周（4月13日至19日）全球AI大模型的总调用量降至20.6万亿Token，连续两周呈现下降趋势。

引人关注的是，在统计的AI大模型中，中国AI大模型的周调用量环比下降了23.77%，降至4.44万亿Token；而美国AI大模型的周调用量则环比增长了20.62%，达到4.91万亿Token，这是近两个月来美国首次超越中国。这一逆转现象与全球范围内掀起的算力涨价潮不谋而合。

全球调用量逆转，算力成本上涨成主因

根据OpenRouter的最新数据，上周全球AI大模型总调用量为20.6万亿Token，在连续十周增长后，首次出现连续两周的下滑。其中，中国AI大模型的周调用量减少至4.44万亿Token，较前一周下降了23.77%；而美国AI大模型的周调用量则增至4.91万亿Token，环比增长20.62%，两个月来首次领先中国。

全球AI大模型调用量从持续增长到突然下降，这一转折点主要归因于全球性的算力成本攀升。自3月份以来，阿里云、腾讯、百度等国内云服务巨头纷纷上调了大模型相关服务的价格。

4月8日，智谱在发布GLM-5.1的同时，再次将价格上调10%，完成了今年的第三次价格调整。调整后，GLM-5.1在编程场景的缓存命中Token价格已接近Anthropic旗下的Claude Sonnet 4.6，这标志着国产大模型首次在核心应用场景与海外领先者实现了价格上的并驾齐驱。

与此同时，海外AI领域的领军企业Anthropic也对其定价策略进行了调整，将企业级产品Claude Enterprise的订阅模式从“每月每用户最高200美元固定费用”转变为“按实际算力消耗计费，并额外收取每月20美元固定费用”。

这一变化意味着，对于轻度用户而言，月费用可能会有所降低；但对于重度用户来说，费用则可能大幅增加。软件授权谈判协助公司Redress Compliance的联合创始人Fredrik Filipsson指出，新的定价策略可能导致重度用户的成本翻倍甚至三倍。

国产模型面临“产品力”考验

“随着Token资费的普遍上涨，使用成本增加，用户不得不控制调用总量以节约成本。”上海财经大学特聘教授李明远在接受徽声在线采访时表示，当价格优势不再明显时，模型的产品力将成为影响用户选择的关键因素。

李明远分析指出，上周美国AI大模型调用量的回升，主要得益于Anthropic旗下的Claude Sonnet和Opus模型的强劲表现。这两款模型在编程领域已成为“标配”，而国产大模型在这方面的产品力仍有待提升。

根据OpenRouter的数据，上周Claude Sonnet 4.6荣登榜首，周调用量达到1.38万亿Token，环比增长19%；Claude Opus 4.6则位居第三，周调用量为1.22万亿Token。这两款模型合计占据了美国AI大模型周调用量的五成以上。

相比之下，国产模型近期则呈现出“过山车”般的行情。

在前一周（4月6日至12日），阿里的Qwen3.6 Plus还以1.66万亿Token的周调用量位居全球榜首，但仅仅过了一周（4月13日至19日），其排名便大幅下滑，甚至跌出了榜单。

此外，记者还注意到，此前多次上榜的Kimi K2.5、智谱GLM系列模型已经连续三周未能进入榜单；而一度冲上榜单第二的阶跃星辰Step 3.5 Flash，在近两周也同样无缘榜单。

李明远认为，OpenRouter平台的用户主要以开发者和中小企业为主，他们对模型的迭代能力和垂直场景的产品力有着极高的要求。“市场用户有向头部主力模型集中的趋势，在能够触及的范围内，用户只会选择最好的。”他指出，随着用户场景的不断拓展，模型需要具备更强的工具调用能力、多Agent支持能力以及长程复杂任务的持续达成能力，“目前OpenRouter上的大部分模型在这些方面还需要进一步提升”。

有业内专家在接受徽声在线采访时也表示，在算力成本上涨的背景下，行业内普遍更倾向于选择性能稳定、输出效果可靠的工具，价格已不再是首要考虑因素。

专家：全球Token消耗量仍将持续快速增长

那么，短期内的数据波动是否意味着AI应用的热潮正在消退呢？

“现在下结论还为时过早。”李明远提醒道，OpenRouter的Token调用量仅占全球总消耗量的约2%至4%，其排名的波动更多反映的是开源、二线及新发模型之间的竞争态势，并不能代表整个市场的走向。

事实上，成本压力正在推动市场进行进化。李明远观察到，自今年初以来，OpenClaw等各类智能体、多Agent应用已经将Token调用量提升至去年底的两三倍水平；而成本的大幅上升，也促使企业和用户开始采用记忆优化、提示词压缩、Harness Engineering（约束工程）等手段来主动降低消耗。

记者了解到，甚至有中小创业者已经将Token使用量纳入了员工绩效考核体系。市场正在从单纯追求数量的“堆量”阶段，向追求更高投入产出比的“提效”阶段转变。

更深层次的变化在于AI应用场景本身的质变。国联民生证券的一份研报中提出了“Token通胀”的概念。这并非指Token本身的价格上涨，而是指单位时间内、单位用户的Token消耗量在结构上出现了上升。

用户的需求正在从浅层次的“问答”向深层次的“执行任务”转变。Token不再是传统互联网时代边际成本几乎为零的“流量”，而是执行生产任务时必不可少的“燃料”。

摩根大通在研报中对中国市场做出了极为乐观的预测，预计2025年至2030年期间，中国Token消耗量的年复合增长率将达到330%，五年内将实现370倍的增长。

李明远同样对长期趋势保持坚定乐观的态度：“就中长期而言，无论OpenRouter上的统计数据如何波动，包括中国在内，全球Token消耗总量都将处于快速增长的通道中，未来两三年内有望实现数十倍甚至数百倍的增长。”

眼下的调用量下滑，或许只是价格冲击下的一次短暂调整。真正的问题并非AI热潮是否消退，而是当Token从“免费试用”走向“真实定价”时，谁的模型能够经得起市场用真金白银的检验。

点击展开全文