混元重建后首秀,姚顺雨在腾讯交出亮眼成绩单
2026-04-23 20:17:27未知 作者:徽声在线
徽声在线记者 | 陆柯言
徽声在线编辑 | 文姝琪
4月23日,腾讯正式对外推出混元Hy3 preview语言模型,并宣布将其开源。这一动作标志着腾讯首席AI科学家姚顺雨在入职近四个月后,交出了其首份亮眼的成绩单。
据腾讯官方介绍,混元Hy3 preview是一款融合了快慢思考的混合专家模型(MoE),拥有总计2950亿个参数,其中激活参数为210亿个,最大可支持256K的上下文长度。目前,该模型已经在腾讯的元宝、ima、WorkBuddy、CodeBuddy等多款内部产品中成功上线,而微信公众号、腾讯新闻等产品也计划在未来陆续接入。
腾讯元宝中,Hy3 Preview已正式投入使用
据徽声在线了解,早在2026年2月,混元团队便着手重建了包括预训练和强化学习在内的大模型研发基础设施。Hy3 preview作为重建后训练的第二个模型,也是混元迄今为止最为智能的模型,在聊天、代码编写、智能体交互、数理推理、指令遵循以及上下文理解等多个实用能力方面均实现了显著提升。
在业界,模型研发通常涵盖高质量数据准备、预训练、后训练以及强化学习或精调等多个环节。若算上前期的架构探索和后期的评测优化,从零开始打造一个完整的大版本周期大约需要6至12个月。然而,混元团队在研发架构升级、AI基础设施重建以及模型上线发布等方面,仅用了不到三个月的时间便完成了Hy3 preview的研发与部署。
混元团队方面透露,在训练新模型时,团队并未盲目追求参数数量的增加(即Scale Up),而是将更多核心资源投入到数据质量的提升上。尽管Hy3 preview的总参数数量相较于前一版本有所减少,但其性能却更为“实际”。理论上,3000亿个参数是模型能力与效率之间的最优平衡点,复杂推理、长上下文理解以及指令遵循等能力在这个参数量级下已经能够得到充分释放。
在成本方面,经过量化处理的3000亿级别MoE模型可以实现单机部署,从而大幅降低了部署所需的硬件成本。
姚顺雨表示,Hy3 preview的发布仅仅是混元大模型重建的第一步。
回顾2026年1月,马化腾在公司年会上曾公开表示,腾讯在AI领域的动作相对迟缓,问题可能出在基础设施不足、模型迭代频率以及平台能力等方面。而在随后的年度业绩会上,腾讯总裁刘炽平也提到,腾讯正在重构混元团队的组织方式和工作流程,重点提升数据质量,并重建预训练与强化学习的基础设施。
几乎在同一时期,腾讯解散了已经设立十年之久的AI Lab。这一决策的背后,是腾讯AI研发团队长期分散在不同事业群,研究、工程与模型能力并未完全统一,导致协同成本较高。姚顺雨曾在内部强调,要坚决打破部门之间的壁垒。
据晚点LatePost报道,姚顺雨还曾在内部会议上指出,过去的混元模型过度追求榜单成绩,将打榜的语料放入训练集,导致数据被污染,进而影响了模型在真实场景中的表现。他希望团队未来能够摒弃打榜行为,不再过分依赖榜单来指导工作。
因此,在Hy3 preview的研发过程中,团队并未完全依赖行业通用的公开评测集,而是自建了50多个Benchmarks(评测基准)来评估模型的实际能力和落地性。同时,团队还注重追求模型与腾讯内部业务的贴合度,让模型在实际应用中不断学习进化。
姚顺雨表示,混元团队将通过这次发布获得全面的体验反馈,以进一步提升Hy3 preview正式版的实用性。此外,团队还在继续扩大预训练和强化学习的规模,以提升模型的智能上限,并通过与腾讯众多产品的深入Co-design(协同设计)来提升模型的实用性,探索非同质化的模型能力。
混元团队还透露,在新的基础设施和技术理念的支撑下,更大尺寸的模型也已经在紧锣密鼓的研发之中。
重建后的混元,正面临着一个全新的竞争环境。两个月前,字节跳动先后发布了Seed 2.0大语言模型和新一代视频生成模型Seedance 2.0,并持续进行高频更新。第三方研究机构QuestMobile的数据显示,一季度豆包的月活跃用户已达3.45亿,用户规模位居国内AI应用之首。而在本月,阿里巴巴也发布了Qwen3.6的多个版本。更早之前,阿里巴巴还认领了近期在榜单上表现抢眼的神秘视频生成模型HappyHorse。
另一个不可忽视的变量是DeepSeek-V4的发布。腾讯元宝曾凭借快速接入DeepSeek而破圈,但对DeepSeek的依赖也曾一度让元宝陷入被动。据The Information报道,腾讯、阿里正在洽谈投资DeepSeek,目标估值超过200亿美元,但腾讯方面并未对此作出回应。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾公开表示,主流大模型的能力差距正在逐步缩小,企业的核心需求已经不再是拥有最好的模型,而是如何通过系统工程将模型的能力最大程度地发挥出来。他认为,在同样的模型能力下,不同的大模型脚手架或Harness的设计,都会对实际使用效果与tokens成本产生很大影响。而腾讯旗下丰富的场景入口、工具生态等都可以为此提供优势条件。
在此之前,这份混元重建后的首份答卷,正静静地等待着用户和市场的检验。


