AI价格战升级：DeepSeek V4百万Token输入低至0.25元，国际大模型价格悬殊700倍

2026-04-26 10:02:52未知作者:徽声在线

甫一亮相便引发行业热议的DeepSeek V4系列模型，近日推出限时价格优惠活动，再次成为AI领域焦点。

据徽声在线4月26日报道，DeepSeek最新推出的DeepSeek-V4-Pro模型API开启2.5折限时特惠，其中输入（缓存命中）价格低至0.25元/百万Tokens，输入（缓存未命中）价格为3元/百万Tokens，输出价格为6元/百万Tokens，优惠活动将持续至5月5日。这一价格策略不仅刷新了行业认知，更在AI算力成本持续攀升的背景下显得尤为突出。

对比国际市场，价格差异更为显著。根据Open Router最新数据，海外主流AI大模型GPT-5.5 Pro的加权平均输入价格高达30美元/百万Token，输出价格更是达到180美元/百万Token，与DeepSeek V4 Pro的输入价格相差超过700倍。即便是GPT-5.5标准版，其输入输出价格也分别达到5美元和30美元/百万Token。其他国际知名模型如Anthropic Claude Opus系列、OpenAI GPT-5.4以及谷歌Gemini 3.1 Pro系列，输出价格普遍在12-25美元区间，均与调价后的DeepSeek V4 Pro形成巨大价差。

值得注意的是，在当前全球AI算力成本普遍上涨的背景下，DeepSeek V4的价格策略显得尤为激进。今年以来，阿里云、百度智能云、腾讯云等国内头部企业纷纷上调AI相关产品价格，形成鲜明对比。其中，百度智能云在3月18日宣布，受全球AI应用快速发展影响，算力需求持续攀升，核心硬件及相关基础设施成本显著上涨，自4月18日起对AI算力相关产品服务上调5%至30%，并行文件存储等上调约30%。

阿里云则在4月13日宣布，对其大数据开发治理平台DataWorks进行重大调整，取消标准版、专业版用户每日调用API的数量限制。变更自2026年4月14日起逐步实施，其中DataWorks标准版每月免费调用额度调整为10万次，专业版调整为50万次，超出部分采用OpenAPI按量付费模式。

腾讯云的价格调整更为频繁，今年已连续两次宣布涨价。继3月11日对部分模型启动正式收费及涨价后，4月9日再次发布公告称，鉴于全球AI算力需求持续激增，核心硬件供应链成本大幅上涨，将于2026年5月9日起对AI算力、容器服务及弹性MapReduce（EMR）相关产品刊例价进行调整。

下游模型市场同样呈现价格上扬趋势。国产大模型厂商智谱年内已进行三次API价格上调。2月12日，智谱对GLM Coding Plan套餐实施结构性调价，整体涨幅自30%起，并在价格调整函中明确表示涨价源于市场需求持续强劲增长，用户规模与调用量快速提升。3月16日，智谱发布专为智能体场景深度优化的通用大模型GLM-5-Turbo，并上调其API价格20%。4月8日，智谱正式发布GLM-5.1，再度提价10%，调价后其Coding场景缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6水平。

DeepSeek此次引发全球关注，除了创新性的技术架构外，更在于其对国产芯片的全面适配。华为计算发布信息显示，昇腾超节点产品已全面支持DeepSeek V4系列模型。通过双方芯模技术的紧密协同，实现了昇腾超节点全系列产品对DeepSeek V4的深度适配。其中，昇腾950通过融合kernel和多流并行技术，有效降低了Attention计算和访存开销，大幅提升推理性能，结合多种量化算法，实现了高吞吐、低时延的模型推理部署。昇腾A3超节点系列产品也完成全面适配，并为用户提供了基于该节点的训练参考实现。

寒武纪也在DeepSeek V4发布后第一时间宣布，基于vLLM推理框架完成了对DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配，适配代码已开源至GitHub社区，为开发者提供了更多选择。

据DeepSeek最新技术论文披露，V4系列的核心创新在于其独特的"混合注意力架构"。该架构由两种机制交替叠加构成：CSA（压缩稀疏注意力）和HCA（重度压缩注意力）。CSA机制专注于处理精细的中程信息，而HCA机制则擅长处理粗粒度的超长程信息。两种机制在模型的不同层交替出现，形成互补。同时，每个注意力层还保留了一个"滑动窗口注意力分支"，专门负责最近128个token的近邻局部信息，有效弥补了压缩机制可能丢失局部细节的缺陷。

在100万token的超长上下文场景下，与上一代V3.2相比，V4-Pro的推理计算量（FLOPs）仅需27%，KV缓存（模型的"工作记忆"）需求降至10%；V4-Flash的表现更为极端，推理计算量降至10%，KV缓存需求降至7%。这种显著的性能提升和成本降低，使得DeepSeek V4系列在长文本处理领域具有明显优势。

点击展开全文