DeepSeek携手北大推出DSpark框架：大模型推理效率实现质的飞跃

2026-06-27 21:02:50未知作者:徽声在线

6月27日，一个引人注目的消息传来：DeepSeek研究团队携手北京大学，共同发表了一篇题为《DSpark》的研究论文，该研究聚焦于speculative decoding（推测解码）领域，提出了一种旨在显著提升大模型推理效率的创新方法。

论文深入剖析了当前并行“草稿生成”技术存在的瓶颈。尽管这种方法能够一次性生成更长的token序列，但由于缺乏足够的token间关联性，往往导致大量生成的草稿被拒绝，进而造成验证算力的无谓消耗。针对这一问题，DSpark框架创新性地引入了半自回归结构，它在并行生成的核心机制上巧妙地融入了轻量级顺序模块，从而有效增强了token之间的依赖关系，大幅提升了草稿的整体质量。

不仅如此，DSpark还独辟蹊径地提出了“基于置信度的动态验证机制”。这一机制能够根据不同请求的成功概率以及系统的实时负载情况，智能地调整验证长度，从而最大限度地减少无效计算开销。在严格的离线测试中，DSpark展现出了卓越的性能，显著提升了可接受生成长度；而在DeepSeek-V4线上系统的实际应用中，与基线模型相比，其推理速度更是实现了约60%至85%的飞跃，同时有效降低了高并发场景下的吞吐损耗。

值得一提的是，为了推动相关领域的进一步研究与发展，论文作者还慷慨地开源了模型检查点以及训练框架DeepSpec，为整个社区的研究工作提供了有力的支持。

点击展开全文