Hy3 preview震撼发布 混元重建迈出坚实步伐 腾讯在智能体时代重拾节奏
2026-04-23 21:11:01未知 作者:徽声在线
徽声在线4月23日消息(记者 林晓)腾讯在不久前的财报媒体交流会上曾透露,其混元大模型(Hunyuan)的3.0版本即将面世。今日,这一备受瞩目的版本终于正式亮相。
据徽声在线记者从腾讯内部获悉,腾讯混元Hy3 preview语言模型不仅发布,还选择了开源之路。Hy3 preview作为一款融合了快慢思考的混合专家模型,拥有总计2950亿的参数,其中激活参数达到210亿,最大能够支持256K的上下文长度。
今年2月,混元团队对预训练和强化学习的基础设施进行了全面重建,并确立了模型追求实用性的三大原则:能力体系化、评测真实性以及性价比的极致追求。
腾讯首席AI科学家姚顺雨详细介绍,Hy3 preview标志着混元大模型重建工作的正式启动。同时,腾讯还在持续扩大预训练和强化学习的规模,旨在提升模型的智能上限。通过与腾讯众多产品的深度协同设计,模型在真实场景中的综合表现得到不断提升,特色模型能力的探索也已拉开序幕。
在成本方面,Hy3 preview相较于前一代模型有了显著降低。在腾讯云大模型服务平台TokenHub上,Hy3 preview的输入价格最低仅为1.2元/百万tokens,若输入命中缓存,则价格更是低至0.4元/百万tokens,而输出价格也控制在最低4元/百万tokens。此外,腾讯云还与混元联手推出了定制的Hy3 preview Token Plan套餐,个人版每月最低仅需28元。
据了解,Hy3 preview在Coding和智能体(如被昵称为“龙虾”的应用)等场景中表现尤为出色。
此前,徽声在线记者曾报道,腾讯旗下的全场景AI智能体WorkBuddy于3月9日正式上线。该智能体完全兼容OpenClaw技能,并支持无缝接入QQ、飞书、钉钉等主流工具。
为此,徽声在线记者第一时间利用WorkBuddy对Hy3 preview进行了内测体验。
在执行全网信源交叉核验的任务时,记者发现WorkBuddy支持多步搜索,能够迅速进行信息判断、信源汇总整理等工作,效率极高。
针对基于已有素材生成新闻稿件大纲的任务,WorkBuddy在获得授权后,能够自主读取桌面文件,并在这一过程中调用多达26个工具。任务完成后,它还会对已完成的任务进行总结记忆,以便后续参考。
安全性是用户在使用“龙虾”类产品时最为关心的问题。记者在内测过程中注意到,当遇到可能存在较高风险的环节时,WorkBuddy会主动进行提示,只有在用户明确点击执行后,才会继续任务执行,确保了使用的安全性。
在生成新闻稿件大纲内容后,WorkBuddy能够直接将结果生成word文档并保存至桌面。值得一提的是,由于系统环境缺少开发者工具导致Python无法正常使用,WorkBuddy最终自主选择了macOS自带工具来创建文档,展现了其强大的适应能力。
徽声在线记者了解到,在各种真实的生产与生活场景中,模型需要面对的首要挑战是理解杂乱冗长的上下文并遵从复杂多变的规则。为此,腾讯混元提出了CL-bench和CL-bench-Life来评估模型的上下文学习能力,使得Hy3 preview在模型上下文学习和指令遵循能力上有了显著提升。
官方数据显示,在CodeBuddy、WorkBuddy等产品上,Hy3 preview的首token延迟降低了54%,端到端时长也缩短了47%。在实际用户环境中,Hy3 preview能够驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、MCP工具链编排等多样化办公场景,展现了其强大的实力。
回顾过去一年,腾讯在AI战略上的步伐明显加快。从AI原生应用元宝到覆盖C端和B端的各类产品,腾讯正在利用AI加速自身业务的进化,并借助自身已有的产品力和入口级优势,快速构建AI时代的竞争力。
目前,Hy3 preview已经在元宝、ima、WorkBuddy、CodeBuddy等众多腾讯内部产品中上线,并即将在微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等主线产品中陆续上线。此外,Hy3 preview还支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub,为用户提供更多选择。
有知情人士透露,此次Hy3 preview的上线发布,也意味着腾讯在AI领域找回了自己的节奏和步伐。
然而,值得注意的是,当前模型厂商之间的竞争已经趋于白热化,相关企业纷纷将目光投向了业内最为关注的智能体领域。
本月初,阿里千问也发布了新一代大语言模型Qwen3.6-Plus,引起了广泛关注。
就在4月22日晚,Qwen3.6-27B也选择了开源。公开信息显示,Qwen3.6-27B使得本地部署的模型也能完成以往只有大尺寸或是MoE模型才能实现的智能体编程任务,还可集成到包括OpenClaw、Claude Code和Qwen Code等第三方编程助手中,展现了其强大的兼容性和扩展性。
今日,小米也宣布其Xiaomi MiMo-V2.5系列模型正式开启公测。据悉,该系列模型拥有更强的推理能力、更稳的Agent表现、更长的上下文支持、更强的指令遵循与模糊指令理解能力以及更好的全模态感知和理解能力,备受期待。
另据媒体报道,DeepSeek的新一代旗舰大模型V4也或将于本周发布,引发了业界的广泛猜测和期待。
随着模型上限的不断接近和模型更迭的日益频繁,各家厂商如何结合自身优势,借势模型能力的提升来巩固生态占位,或将成为下半场竞争的核心所在。
下一步,国内AI模型赛道头部玩家的竞争将走向何方?徽声在线记者将持续关注并为大家带来最新报道。