13小时编码、5天持续运行!Kimi K2.6开源挑战闭源巨头,AGI工业化新赛道能否被撕开?

2026-04-22 15:08:35未知 作者:徽声在线

月之暗面(Moonshot AI)旗下的Kimi再次在AI领域掀起波澜。

在4月20日这个深夜,Kimi正式对外发布并开源了其最新的Kimi K2.6模型。据官方介绍,这款模型在代码生成能力、长程任务执行能力以及Agent(智能体)集群协作能力方面均达到了行业领先水平。

K2.6模型在继承上一代K2.5技术路线的基础上,对编码和智能体能力进行了深度升级。尤为引人注目的是,其Agent集群调度能力实现了质的飞跃,最高可支持300个子Agent同时并行工作,完成多达4000个协作步骤,这一突破显著提升了模型在处理复杂长流程任务时的效率。

当前,大模型产业的竞争焦点已经悄然转变,从以往的“通用对话能力”比拼,转向了长周期、多工具协同的真实工作流落地能力。在这一背景下,模型的长时间稳定工作能力成为了决定胜负的关键因素。

早在今年3月,月之暗面的创始人杨植麟就在2026年中关村论坛年会全体会议上明确指出,大模型的本质在于将能源高效转化为智能,而规模化则是AI发展的核心基石。但他同时强调,规模化并非简单地堆砌算力和能源,而是要以提升效率为核心。为此,Kimi围绕Token(词元)效率、长上下文处理以及Agent集群三大方向,精心构建了其规模化策略,力求在有限资源下实现智能的最大化输出。

K2.6模型不仅支持长达13小时的不间断编码,还能实现5天的自主稳定运行,其深度检索能力更是超越了GPT-5.4等业界标杆。

从多项权威基准测试的结果来看,K2.6在通用智能体、编程以及视觉智能三大领域均取得了显著提升。

在博士级难度的“人类最后的考试(Humanity's Last Exam)”全工具测试中,K2.6以54.0%的优异成绩荣登榜首。在评估Agent深度检索能力的DeepSearchQA测评中,K2.6更是以92.5%的高分领先于GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6等强劲对手。此外,在BrowseComp、OSWorld-Verified等智能体测评中,Kimi K2.6也均展现出了行业前列的卓越表现。


图片来源:月之暗面官方微信号

然而,K2.6也并非完美无缺。在部分维度上,它与头部闭源模型仍存在一定差距。例如,在SWE-bench多语言测试中,其得分略低于Claude Opus 4.6与Gemini 3.1 Pro。而在Toolathlon工具调度任务以及MathVision等视觉智能测评中,其表现也与GPT-5.4存在细微差距。

尽管如此,K2.6的能力提升方向仍然具有重大意义。它标志着开源生态中正在孕育出能够胜任长周期、复杂任务的能力,而这一技术方向也已成为当下国产大模型行业的共同追求。

近期,自主Agent应用如OpenClaw(俗称“小龙虾”)等迅速崛起,它们对模型的要求远高于传统对话式交互。这类场景要求AI能够跨应用不间断自主运行,主动完成任务规划、代码执行以及跨平台协同操作等复杂任务,对模型的上下文承载能力、长期记忆连续性以及多步骤推理稳定性均提出了更高要求。

针对自主Agent赛道的特殊需求,Kimi K2.6也进行了针对性增强。其Agent的自主化执行能力得到了显著提升,在OpenClaw、Hermes Agent等自动化任务场景中表现尤为突出。官方披露,其RL(Reinforcement Learning,强化学习)基础设施团队已基于K2.6 Agent实现了连续5天不间断自主稳定运行,充分验证了其长时工作可靠性。

杨植麟曾在发布K2.5时详细介绍了其Agent集群能力:“在K2.5上,我们从单个Agent进化到了Agent集群,从单个专家进化成了一个专业团队。”他进一步解释道,K2.5会创建并协调一大群专项Agent并行工作,这些专项Agent本质上都是K2.5的分身,各自承担不同的角色和子任务,且没有任何预设规则。所有的角色分配和任务拆解都是由K2.5现场即时决定,展现了极高的灵活性和智能性。

迭代至K2.6版本,Agent集群架构得到了全面扩容升级。它支持调度不同技能特长的Agent进行互补协作,组合各项能力以应对更复杂的任务挑战。在架构上,K2.6扩展至最多可支持300个子Agent并行完成4000个协作步骤(而K2.5最多仅支持100个分身并行处理1500个步骤),实现了更大规模的并行化处理。

代码能力作为本次迭代的核心亮点之一,K2.6在长程编码能力方面取得了主要突破。它支持不间断编码长达13小时,能够完成超过4000行代码的编写或修改工作,覆盖Rust、Go、Python等多种编程语言以及前端、运维、性能优化等多个应用场景。通过代码与视觉能力的深度融合,K2.6还能够交付专业级的Web应用,展现了其强大的综合应用能力。


图片来源:每经媒资库

Kimi估值飙升,杨植麟能否引领AGI工业化新赛道?

在2026年中关村论坛年会后,杨植麟进一步阐述了他对Agent发展的深刻洞察。他认为,与传统对话式AI的“即时问答”模式不同,真正受用户信赖的Agent必须具备长时间持续工作的能力,能够承接更复杂的任务挑战。这背后需要突破训练难度、数据积累、上下文承载等多重技术瓶颈。

杨植麟指出,这种能力的突破将带来生产力的指数级提升。Agent或将成为生产力的核心载体,其产生的Token(词元)在一定程度上等价于GDP(国内生产总值)。长期来看,这一变革甚至可能让现有GDP实现数倍增长,为经济社会发展注入强大动力。

《每日经济新闻》记者注意到,这一技术洞察直接体现在了Kimi近期的迭代节奏中。继K2.5首次引入Agent集群概念后,Kimi开始在更基础的架构层面展开深入探索。

在今年3月发布的技术报告中,团队对大模型核心结构的残差连接进行了重新设计,让每一层可选择性关注此前各层的输出。这一创新改进获得了美国企业家马斯克的“令人印象深刻”评价,以及OpenAI前研究副总裁Jerry Tworek“深度学习2.0要来了”的高度点评。

此外,杨植麟还在中关村论坛年会上预测了大模型训练的下一阶段发展趋势:“越来越多的研究工作将由AI主导。未来每个研究员将配备海量的Token资源,由AI自动合成新任务、构建新环境、定义最优奖励函数,甚至自主探索全新网络架构。在这一趋势下,整个AI领域的研发速度将进一步加快,推动技术不断向前发展。”

在技术快速演进的同时,Kimi在资本市场上也获得了积极反馈。

据市场知情人士向《每日经济新闻》记者透露,截至3月14日,Kimi的估值已攀升至180亿美元,短短3个月内翻了4倍。且新一轮10亿美元的融资正在紧锣密鼓地推进中。不到3个月完成3轮融资,Kimi创下了国内大模型连续融资的新纪录,也成为国内估值最快突破百亿美元的独角兽企业之一。

Kimi估值的飙升主要得益于两方面因素。一方面,产品迭代与付费收入出现了较快增长。2026年开年以来,K2.5模型、Kimi Claw等新品先后上线并升级,适配了多办公平台,带动了1月底以来20天的收入超过了2025年全年。Stripe数据显示,其个人订阅订单1月环比增长了8280%,2月再次增长了123.8%,成功跻身全球榜单前十。另一方面,AGI赛道整体升温也为Kimi的估值提供了有力支撑。智谱、MiniMax等企业在港股上市后市值的上涨,为行业头部玩家提供了估值参考和上涨动力。

当前,AGI行业已经从参数竞赛转向了技术效率与落地能力的竞争。Agent时代的竞争规则正在被重新书写,转向如何做得更久、更稳、更完整。Kimi以技术演进为主线,在这一过程中逐步确立了自身定位。而大模型竞争格局是否会因此发生根本性变化,仍有待观察各厂商后续的迭代节奏与生态建设能力。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
13小时编码、5天持续运行!Kimi K2.6开源挑战闭源巨头,AGI工业化新赛道能否被撕开?13小时编码、5天持续运行!Kimi K2.6开源挑战闭源巨头,AGI工业化新赛道能否被撕开? 兆易创新GD32F5HC系列微控制器:嵌入式领域的新标杆兆易创新GD32F5HC系列微控制器:嵌入式领域的新标杆 中国新能源产品涌向全球,光伏出口单月环比猛翻一倍中国新能源产品涌向全球,光伏出口单月环比猛翻一倍 中美联合研发SRN-901显著延长小鼠寿命,国药赛诺根已引进相关产品中美联合研发SRN-901显著延长小鼠寿命,国药赛诺根已引进相关产品 阿里巴巴发布AI数字人“小酒窝”,全面渗透生态应用场景阿里巴巴发布AI数字人“小酒窝”,全面渗透生态应用场景 AI算力浪潮下通信ETF(515880)创历史新高,光模块产业链迎来黄金发展期AI算力浪潮下通信ETF(515880)创历史新高,光模块产业链迎来黄金发展期