林俊旸离职后首谈AI未来:从推理式思维到智能体思维的跨越
2026-03-27 10:17:47未知 作者:徽声在线
3月26日,前阿里巴巴千问大模型技术掌舵人林俊旸在个人社交平台发布了离职后的首篇深度技术长文。尽管文中未透露其未来职业规划的具体动向,但他对大模型技术发展趋势的独到见解及对AI下一阶段发展方向的前瞻性预判,迅速引发了行业内的广泛热议与深度思考。
在这篇题为From "Reasoning" Thinking to "Agentic" Thinking(从“推理式思维”迈向“智能体思维”)的文章中,林俊旸深入剖析了近两年大模型技术如何重塑了行业对模型评估的标准与核心期待。他指出,这一变革不仅体现在技术层面,更深刻影响了行业对AI未来走向的认知。
他详细回顾道,2025年上半年,整个行业的主要精力都集中在“推理式思考”的优化上。通过强化学习等先进技术,模型能够在给定输入后,通过内部严密的逻辑推演生成精准的推理链,从而显著提升回答的准确性。OpenAI的o1模型和DeepSeek-R1模型便是这一技术范式的杰出代表。林俊旸形象地比喻道:“那时,行业都在琢磨如何让模型‘多思考一会儿’,而现在,是时候探讨下一步的发展方向了。”
他坚定地认为,“智能体思维”将是AI下一阶段的核心发展方向。在这一模式下,模型不再局限于内部的静态推理,而是为了行动而思考,在与环境的动态交互中不断调整并优化其计划。这种思维方式的转变,将使AI更加贴近真实世界的复杂性和不确定性。
林俊旸还大方分享了千问团队在这一领域的实践经验。他透露,2025年初,团队曾怀揣一个宏伟目标:打造一个统一的系统,将思考模式与指令模式完美融合。尽管这一方向在理论上具有前瞻性,但在实践中却遭遇了诸多挑战。他坦言,两种模式在数据分布和行为目标上的显著差异,使得合并过程异常艰难。推理式模型依赖于逻辑严密的可验证数据,而智能体模型则需要完整的交互轨迹数据来支撑其决策。因此,真正实现成功合并,需要构建一个平滑的推理力度光谱,以平衡两种模式的需求。
他进一步指出,推理链的长度并非衡量模型智能水平的唯一标准。很多时候,过长的推理链反而可能意味着模型在无效地消耗算力,而非真正提升其智能水平。这一观点,无疑为行业内的模型优化提供了新的思考角度。
林俊旸强调,千问团队已经敏锐地意识到,行业正在从单纯训练模型的时代,迈向训练智能体的新时代。这一转变的核心特征在于与真实世界的闭环交互。智能体思维的核心问题,也从模型“能否长时间思考”转变为“模型能否以一种支撑有效行动的方式进行思考”。这一转变,将深刻影响AI技术的未来发展方向。
他大胆预测,智能体式思维将成为未来主流的思维形态。在这一趋势下,模型架构和训练数据虽然仍然重要,但环境设计、rollout基础设施、评估器的稳健程度以及多个Agent之间的协调机制等,都将进入技术发展的核心圈。这些因素的协同作用,将共同推动AI技术向更高层次迈进。
回顾林俊旸的离职历程,3月4日,他在社交媒体上公开宣布了自己从千问卸任的消息。同日,Qwen后训练负责人郁博文和Qwen 3.5/VL/Coder核心贡献者李凯新也透露了离职意向。这一系列人事变动,无疑为阿里大模型团队带来了新的挑战与机遇。
3月5日,阿里集团CEO吴泳铭在内部邮件中正式回应了这一人事变动。他表示,公司已批准林俊旸的辞职申请,并对其过去在岗位上的辛勤付出表示衷心感谢。同时,他宣布阿里云CTO、通义实验室负责人周靖人将继续带领团队推进后续工作,并透露公司将成立基础模型支持小组,以协调集团资源支持基础模型建设,确保团队在技术变革中保持领先地位。
林俊旸,这位出生于1993年的年轻技术专家,曾是阿里最年轻的P10级技术领军人物。他硕士毕业于北京大学外国语学院,2019年加入阿里达摩院担任高级算法工程师,逐步参与到M6、OFA等核心模型的研发工作中。2022年底,随着通义实验室的成立,他被任命为千问大模型技术负责人,带领团队成功打造了Qwen系列开源模型。截至他离职前,Qwen系列模型的全球下载量已突破6亿次,衍生模型数量超过20万个,为阿里在大模型领域的领先地位奠定了坚实基础。
