寒武纪Day0速配DeepSeek-V4,国产AI芯片生态再攀高峰
2026-04-24 14:09:40未知 作者:徽声在线
今日,寒武纪官方正式对外发布重磅消息:依托自主研发的NeuWare软件生态体系,并结合vLLM框架的强大支撑,已成功实现对深度求索公司最新一代大模型DeepSeek-V4的“Day 0”级别适配工作,且适配代码已面向公众开源共享。值得一提的是,这已是寒武纪连续第二次在DeepSeek新模型发布当天,便迅速推出适配国产芯片的解决方案,展现了其在AI芯片领域的深厚技术积累与快速响应能力。
面对DeepSeek-V4全新的模型架构,寒武纪团队通过精心打造的自研高性能融合算子库Torch-MLU-Ops,对模型中的Compressor、mHC等关键模块进行了专项加速优化;同时,利用BangC编程语言,精心编写了针对稀疏/压缩Attention、GroupGemm等热点算子的极致优化Kernel,从而充分挖掘并释放了硬件底层的潜在性能。此前,双方通过紧密的软硬件协同优化工作,已共同实现了业界领先的算力利用率,为AI应用的高效运行奠定了坚实基础。
与此同时,DeepSeek-V4的预览版也已同步上线并开源,该模型具备百万字级别的超长上下文处理能力,同时在Agent能力与推理性能方面表现出色。寒武纪方面表示,DeepSeek-V4能够原生运行于寒武纪芯片之上,这不仅是对寒武纪技术实力的一次有力证明,更对中国AI产业的未来发展具有里程碑式的重大意义。
