余承东再度掌舵华为盘古大模型，引领AI新征程

2026-06-13 10:04:33未知作者:徽声在线

文/徽声在线吕栋

"在我的字典里，从来不存在第二这个选项，只有第一才是目标。"6月12日下午，在华为开发者大会（HDC 2026）的舞台上，华为常务董事、产品投资评审委员会（IRB）主任、终端BG董事长余承东掷地有声地说道。

此次大会上，余承东不仅重磅发布了HarmonyOS 7操作系统，还宣布华为将推出开源的盘古openPangu 2.0大模型。该大模型包含两个版本，分别是openPangu 2.0 Pro，其总参数量高达5050亿，激活参数量为180亿；以及openPangu 2.0 Flash，总参数量920亿，激活参数量60亿。这一举措无疑为人工智能领域注入了新的活力。

余承东指出，当前AI算力资源极为紧缺，而openPangu大模型做到了与昇腾算力的深度亲和。在单卡吞吐率方面，它领先于业界主流模型，时延表现也更为出色，能够在昇腾算力上实现更高的运行效率，为AI应用的发展提供了有力支撑。

他还透露，openPangu计划于6月30日将七大组件陆续开源上线。与业界通常开源的模型结构、模型权重、技术报告和推理代码等四项内容不同，华为此次额外开源了预训练代码、后训练代码、训推算子这三项关键内容。这一举措旨在让开发者在使用昇腾和盘古大模型时更加高效、便捷，推动整个行业的技术进步。

图源：华为

面对外界的疑问，余承东回应道："很多人可能会问，华为发布的盘古大模型参数为5050亿，而美国一些厂家发布了几十T参数的模型，为什么华为没有推出万亿和几十万亿参数的大模型呢？"

他进一步解释，美国企业拥有几十万卡甚至上百万卡的高性能算力资源，而华为将大量的昇腾算力用于支持国内企业的需求，自身保留的算力卡数量有限，难以满足训练几十万亿参数大模型的需求。

此外，算力成本高昂以及内存价格的大幅上涨也是重要因素。业界如今非常重视大模型推理时的吞吐率和时延，华为开发的几百B参数的模型在运行效率上更具优势，同时也能有效降低成本。

余承东表示："当然，如果我们拥有足够的算力，也会训练更大的模型，然后通过蒸馏技术将模型缩小后再使用。未来，随着算力产能供应的增长，我们会不断提升这方面的能力。"

那么，余承东之前主要负责华为终端业务，为何会突然涉足盘古大模型呢？

原来，去年9月他被任命为华为产品投资评审委员会（IRB）主任，负责对华为重大战略方向的资源投入、项目立项及预算审批进行关键决策。其核心任务是带领华为在人工智能（AI）领域取得全球领先地位，被内部视为"打赢AI关键战役"的核心领导人。

当前，中国AI市场竞争异常激烈，阿里通义、腾讯混元、字节豆包、百度文心等各种国产大模型如雨后春笋般涌现，数据和模型都在飞速发展，中国AI竞争已全面进入"大模型军备赛"的白热化阶段，各大互联网公司都在奋力追赶，不愿落后。

分析人士对徽声在线表示，此次人事任命充分凸显了华为将AI置于未来十年发展核心地位的决心。通过IRB机制，华为能够确保战略资源向AI领域高强度倾斜。余承东权责的扩展，标志着华为AI战略进入资源整合与攻坚落地阶段。他能否像在终端业务领域那样取得成功，将成为观察华为AI全球竞争力的关键窗口。

余承东

其实，余承东并非首次负责盘古大模型。据他讲述，2021年4月他曾负责华为云业务几个月。"当时我代表华为云发布了全中国第一个大模型。在那个时期，不仅全中国，全世界对大模型的概念都还很模糊，我们就已经发布了盘古大模型，堪称这个行业的绝对先驱者。"

"去年国庆节前夕，公司再次让我负责这个大模型。我相信，我会带领团队一路赶超。在我的字典里，没有第二，只有第一。"但他也坦诚，要走向世界第一，面临的挑战非常大，还需要等待算力资源跟上，追赶和超越都需要时间。

余承东还在现场进行了人才招募："中国培养了众多优秀人才，AI人才资源也非常丰富。虽然华为无法提供像互联网公司那样的亿级年收入，但我们依然能够汇聚一批优秀的人才。欢迎全中国的优秀人才加入盘古团队，一起打造全世界最好的盘古大模型。"

他最后还做了一个预告，今年秋天，30B参数的端侧盘古大模型将在麒麟手机芯片上运行。"云侧与昇腾亲和，端侧与麒麟亲和，模型吞吐率将有5倍以上的提升，这将为用户带来更加出色的体验。"

本文系徽声在线独家稿件，未经授权，不得转载。

点击展开全文