深圳国产AI算力集群成功训练1.6万亿参数大模型

2026-06-05 11:22:59未知 作者:徽声在线

根据“深圳发布”的最新消息,深圳河套学院的AI训练平台项目组携手哈尔滨工业大学(深圳)、深圳市大数据研究院以及华为的相关团队,共同与深智城AI算力平台展开深度合作,针对国产算力下的大模型训练进行了联合技术攻关。他们依托昇腾910C这一国产AI算力集群的强大能力,成功完成了拥有1.6万亿参数的DeepSeek-V4-Pro大模型的全参数后训练工作。

这一实践不仅为全球第三方机构在国产算力平台上进行同等级别模型训练的探索提供了宝贵的经验,更证明了国产AI芯片完全有能力支撑起世界级超大参数模型的训练任务,展现了国产技术的硬实力。

此次探索标志着国产算力在适配超大参数大模型方面取得了重要突破,对于提升国内AI产业链的自主化程度、降低行业应用成本以及推动人工智能技术的广泛落地应用都具有深远的意义。目前,该项目已经实现了模型算力利用率(MFU)超过30%的优异成绩,同时关键训练算子的效率也提升了14%,各项性能指标均达到了工业级运行的标准,为国产AI算力的实际应用奠定了坚实基础。

从技术应用的层面分析,调用已有模型进行业务推理与从零开始完成模型的全参数训练是两个截然不同的技术环节,它们在技术难度和硬件要求上存在着显著的差异。而本次试验的结果充分表明,国产AI算力已经具备了承担顶级大模型训练任务的能力,相关技术路径的可行性得到了有力验证。

点击展开全文
你关注的
从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业从“几年一遇”到“一年几遇”,AI时代网络攻防失衡加剧 奇安信齐向东:主战场转向制造业与服务业 微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动
相关文章
大疆Pocket 4P即将发布,手持影像技术路线全面揭秘大疆Pocket 4P即将发布,手持影像技术路线全面揭秘 光互连崛起:通信ETF(515880)领涨3%,光模块占比超半壁江山光互连崛起:通信ETF(515880)领涨3%,光模块占比超半壁江山 5年内达成1.4纳米等效?美国顶尖芯片学者深度剖析华为“韬定律”:揭示先进芯片局限,某些维度研发周期或更短5年内达成1.4纳米等效?美国顶尖芯片学者深度剖析华为“韬定律”:揭示先进芯片局限,某些维度研发周期或更短 跟风“一人公司”:忙了半年,0收入跟风“一人公司”:忙了半年,0收入 可灵独立之路:没有云庇护的视频模型如何突围?可灵独立之路:没有云庇护的视频模型如何突围? 英伟达震撼发布:全球首款全模态物理AI模型NVIDIA Cosmos 3英伟达震撼发布:全球首款全模态物理AI模型NVIDIA Cosmos 3