DeepSeek携手北大推出DSpark框架:大模型推理效率实现质的飞跃

2026-06-27 21:02:50未知 作者:徽声在线

6月27日,一个引人注目的消息传来:DeepSeek研究团队携手北京大学,共同发表了一篇题为《DSpark》的研究论文,该研究聚焦于speculative decoding(推测解码)领域,提出了一种旨在显著提升大模型推理效率的创新方法。

论文深入剖析了当前并行“草稿生成”技术存在的瓶颈。尽管这种方法能够一次性生成更长的token序列,但由于缺乏足够的token间关联性,往往导致大量生成的草稿被拒绝,进而造成验证算力的无谓消耗。针对这一问题,DSpark框架创新性地引入了半自回归结构,它在并行生成的核心机制上巧妙地融入了轻量级顺序模块,从而有效增强了token之间的依赖关系,大幅提升了草稿的整体质量。

不仅如此,DSpark还独辟蹊径地提出了“基于置信度的动态验证机制”。这一机制能够根据不同请求的成功概率以及系统的实时负载情况,智能地调整验证长度,从而最大限度地减少无效计算开销。在严格的离线测试中,DSpark展现出了卓越的性能,显著提升了可接受生成长度;而在DeepSeek-V4线上系统的实际应用中,与基线模型相比,其推理速度更是实现了约60%至85%的飞跃,同时有效降低了高并发场景下的吞吐损耗。

值得一提的是,为了推动相关领域的进一步研究与发展,论文作者还慷慨地开源了模型检查点以及训练框架DeepSpec,为整个社区的研究工作提供了有力的支持。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
苹果、微软涨价后,国内厂商“蠢蠢欲动” ,分析师:部分安卓厂商实际上已开始第二轮调价苹果、微软涨价后,国内厂商“蠢蠢欲动” ,分析师:部分安卓厂商实际上已开始第二轮调价 诺瓦聚变创始人预测:“人造太阳”十年内有望实现诺瓦聚变创始人预测:“人造太阳”十年内有望实现 vivo X Fold6深度评测:折叠屏生产力工具新标杆vivo X Fold6深度评测:折叠屏生产力工具新标杆 苹果多款产品价格上扬,二手市场紧跟涨价,有商家拒发货致消费者损失,晚购一天多花2000元苹果多款产品价格上扬,二手市场紧跟涨价,有商家拒发货致消费者损失,晚购一天多花2000元 AI制药革命进行时:英矽智能创始人揭秘上海创新密码|潮起・上海篇AI制药革命进行时:英矽智能创始人揭秘上海创新密码|潮起・上海篇 零跑要在收缩的MPV市场提高赚钱能力零跑要在收缩的MPV市场提高赚钱能力