AI价格战升级:DeepSeek V4百万Token输入低至0.25元,国际大模型价格悬殊700倍

2026-04-26 10:02:52未知 作者:徽声在线

甫一亮相便引发行业热议的DeepSeek V4系列模型,近日推出限时价格优惠活动,再次成为AI领域焦点。

据徽声在线4月26日报道,DeepSeek最新推出的DeepSeek-V4-Pro模型API开启2.5折限时特惠,其中输入(缓存命中)价格低至0.25元/百万Tokens,输入(缓存未命中)价格为3元/百万Tokens,输出价格为6元/百万Tokens,优惠活动将持续至5月5日。这一价格策略不仅刷新了行业认知,更在AI算力成本持续攀升的背景下显得尤为突出。

对比国际市场,价格差异更为显著。根据Open Router最新数据,海外主流AI大模型GPT-5.5 Pro的加权平均输入价格高达30美元/百万Token,输出价格更是达到180美元/百万Token,与DeepSeek V4 Pro的输入价格相差超过700倍。即便是GPT-5.5标准版,其输入输出价格也分别达到5美元和30美元/百万Token。其他国际知名模型如Anthropic Claude Opus系列、OpenAI GPT-5.4以及谷歌Gemini 3.1 Pro系列,输出价格普遍在12-25美元区间,均与调价后的DeepSeek V4 Pro形成巨大价差。

值得注意的是,在当前全球AI算力成本普遍上涨的背景下,DeepSeek V4的价格策略显得尤为激进。今年以来,阿里云、百度智能云、腾讯云等国内头部企业纷纷上调AI相关产品价格,形成鲜明对比。其中,百度智能云在3月18日宣布,受全球AI应用快速发展影响,算力需求持续攀升,核心硬件及相关基础设施成本显著上涨,自4月18日起对AI算力相关产品服务上调5%至30%,并行文件存储等上调约30%。

阿里云则在4月13日宣布,对其大数据开发治理平台DataWorks进行重大调整,取消标准版、专业版用户每日调用API的数量限制。变更自2026年4月14日起逐步实施,其中DataWorks标准版每月免费调用额度调整为10万次,专业版调整为50万次,超出部分采用OpenAPI按量付费模式。

腾讯云的价格调整更为频繁,今年已连续两次宣布涨价。继3月11日对部分模型启动正式收费及涨价后,4月9日再次发布公告称,鉴于全球AI算力需求持续激增,核心硬件供应链成本大幅上涨,将于2026年5月9日起对AI算力、容器服务及弹性MapReduce(EMR)相关产品刊例价进行调整。

下游模型市场同样呈现价格上扬趋势。国产大模型厂商智谱年内已进行三次API价格上调。2月12日,智谱对GLM Coding Plan套餐实施结构性调价,整体涨幅自30%起,并在价格调整函中明确表示涨价源于市场需求持续强劲增长,用户规模与调用量快速提升。3月16日,智谱发布专为智能体场景深度优化的通用大模型GLM-5-Turbo,并上调其API价格20%。4月8日,智谱正式发布GLM-5.1,再度提价10%,调价后其Coding场景缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6水平。

DeepSeek此次引发全球关注,除了创新性的技术架构外,更在于其对国产芯片的全面适配。华为计算发布信息显示,昇腾超节点产品已全面支持DeepSeek V4系列模型。通过双方芯模技术的紧密协同,实现了昇腾超节点全系列产品对DeepSeek V4的深度适配。其中,昇腾950通过融合kernel和多流并行技术,有效降低了Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的模型推理部署。昇腾A3超节点系列产品也完成全面适配,并为用户提供了基于该节点的训练参考实现。

寒武纪也在DeepSeek V4发布后第一时间宣布,基于vLLM推理框架完成了对DeepSeek-V4-flash和DeepSeek-V4-Pro两个版本的Day 0适配,适配代码已开源至GitHub社区,为开发者提供了更多选择。

据DeepSeek最新技术论文披露,V4系列的核心创新在于其独特的"混合注意力架构"。该架构由两种机制交替叠加构成:CSA(压缩稀疏注意力)和HCA(重度压缩注意力)。CSA机制专注于处理精细的中程信息,而HCA机制则擅长处理粗粒度的超长程信息。两种机制在模型的不同层交替出现,形成互补。同时,每个注意力层还保留了一个"滑动窗口注意力分支",专门负责最近128个token的近邻局部信息,有效弥补了压缩机制可能丢失局部细节的缺陷。

在100万token的超长上下文场景下,与上一代V3.2相比,V4-Pro的推理计算量(FLOPs)仅需27%,KV缓存(模型的"工作记忆")需求降至10%;V4-Flash的表现更为极端,推理计算量降至10%,KV缓存需求降至7%。这种显著的性能提升和成本降低,使得DeepSeek V4系列在长文本处理领域具有明显优势。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
DeepSeek-V4-Pro模型API限时特惠,低至2.5折DeepSeek-V4-Pro模型API限时特惠,低至2.5折 颜宁团队再创辉煌!糖质结构研究取得原子级分辨率突破颜宁团队再创辉煌!糖质结构研究取得原子级分辨率突破 中国科学家推出“灵境造物”智能科研新利器中国科学家推出“灵境造物”智能科研新利器 DeepSeek技术报告揭AI人才战真相:300人团队10人离职,理想主义遭遇资本围剿DeepSeek技术报告揭AI人才战真相:300人团队10人离职,理想主义遭遇资本围剿 中国成功助力巴基斯坦发射PRSC-EO3卫星中国成功助力巴基斯坦发射PRSC-EO3卫星 加密货币全线暴跌,近10万投资者爆仓!美伊局势再添变数加密货币全线暴跌,近10万投资者爆仓!美伊局势再添变数