深圳国产AI算力集群成功训练1.6万亿参数大模型
2026-06-05 11:22:59未知 作者:徽声在线
根据“深圳发布”的最新消息,深圳河套学院的AI训练平台项目组携手哈尔滨工业大学(深圳)、深圳市大数据研究院以及华为的相关团队,共同与深智城AI算力平台展开深度合作,针对国产算力下的大模型训练进行了联合技术攻关。他们依托昇腾910C这一国产AI算力集群的强大能力,成功完成了拥有1.6万亿参数的DeepSeek-V4-Pro大模型的全参数后训练工作。
这一实践不仅为全球第三方机构在国产算力平台上进行同等级别模型训练的探索提供了宝贵的经验,更证明了国产AI芯片完全有能力支撑起世界级超大参数模型的训练任务,展现了国产技术的硬实力。
此次探索标志着国产算力在适配超大参数大模型方面取得了重要突破,对于提升国内AI产业链的自主化程度、降低行业应用成本以及推动人工智能技术的广泛落地应用都具有深远的意义。目前,该项目已经实现了模型算力利用率(MFU)超过30%的优异成绩,同时关键训练算子的效率也提升了14%,各项性能指标均达到了工业级运行的标准,为国产AI算力的实际应用奠定了坚实基础。
从技术应用的层面分析,调用已有模型进行业务推理与从零开始完成模型的全参数训练是两个截然不同的技术环节,它们在技术难度和硬件要求上存在着显著的差异。而本次试验的结果充分表明,国产AI算力已经具备了承担顶级大模型训练任务的能力,相关技术路径的可行性得到了有力验证。

