AI进化论：语言模型与世界模型如何重构未来？罗福莉、朱军等顶尖学者深度解析

2026-06-13 11:03:43未知作者:徽声在线

随着AI coding技术突破关键临界点，智能体（Agent）的自我进化能力显著增强，“AI自主创造AI”的愿景正从概念走向现实。这一变革不仅重塑了技术边界，更预示着数字与物理世界的深度融合即将进入全新阶段。

6月12日，第八届“北京智源大会”开幕式圆桌论坛上，在智源研究院院长王仲远的主持下，小米MiMo大模型负责人罗福莉、清华大学教授兼生数科技创始人朱军、清华大学教授兼面壁智能首席科学家刘知远、南洋理工大学校长讲席教授安波四位顶尖学者，以“重构世界”为主题展开深度对话。这场汇聚产学研前沿力量的讨论，揭示了大模型技术从实验室走向产业化的关键路径。

作为长期深耕大模型研发的一线专家，四位嘉宾从模型能力跃迁切入，延伸至语言模型与世界模型的技术路线之争、递归式自我改进的实践进展，以及AI自进化是否已突破临界点等核心命题。当AI从“执行工具”进化为“创造智能的智能”，数字世界与物理世界的重构将呈现何种轨迹？哪条技术路线能率先实现突破？以下为根据对话实录整理的深度解析（内容经徽声在线编辑优化）：

Anthropic新模型：技术跃迁的中间站还是质变起点？

罗福莉从技术架构角度解析称，Fable 5（Anthropic新模型）本质上是科学化Scaling（规模扩张）的阶段性成果。其参数量级预计达到当前最强开源模型的数倍，体现在三个维度：预训练数据规模的指数级增长、合成数据（AI与人类协作生成）的深度应用，以及测试时规模扩展（test-time Scaling）与强化学习的协同优化。这种多维度的外延拓展，使其成为模型能力进化的重要里程碑。

她特别指出，数据形态的变革具有划时代意义——从互联网文本数据到人机协同的合成数据，标志着模型训练正式进入“智能体时代”。这种转变不仅提升了数据量级，更重构了数据生成逻辑，为模型理解复杂场景提供了新范式。

朱军从应用效果维度补充道，模型规模与数据的协同扩张已带来显著性能提升。在物理世界模拟领域，过去两年间模型从产生“幻觉”到生成影视级专业内容，技术突破有目共睹。他强调，这种进步源于模型精细化程度的提升：数据质量优化、训练规模扩大、算法架构创新三者缺一不可。

面对物理规律学习的争议，朱军认为基础模型的显著进步已为逻辑推理、物理建模等任务奠定基础。他以多任务处理为例，指出新版本模型在Token消耗量上的优化（较前代减少30%-50%），证明智能体正朝着更高效的工具调用与决策方向演进。

AI自进化：概念热潮还是技术革命？

安波从技术演进逻辑出发，认为“自演化”概念虽火爆，但当前智能体仍处于初级阶段。他预测，未来真正颠覆性的突破将发生在工业垂直领域——当通用能力与行业知识深度融合，AI解决实际问题的潜力将得到彻底释放。这种“垂直化落地”趋势，正是技术从实验室走向产业化的必经之路。

罗福莉通过科研流程类比，揭示了模型能力边界的扩展。她指出，顶尖模型已从“完美执行指令”进化到“设计实验流程、验证结果准确性”，但在“提出假设”这一创造性环节仍存在差距。这种差距本质上是人类研究审美（taste）与判断力的体现，但递归自我提升系统的引入正在缩小这一鸿沟。

刘知远从科技革命视角提供宏观框架：他将“智能革命”类比工业革命，强调用AI替代重复脑力劳动的必然性。他预测，AI制造AI将成为高级智能的标志性能力，其发展速度可能远超工业革命（工业革命耗时数百年，而AI制造AI仅需数年）。但他同时警示，技术发展需坚守人类主体性——AI的终极目标应是服务社会，而非替代人类决策。

语言模型与世界模型：双轨并行还是此消彼长？

朱军从信息论角度解析模型进化逻辑：系统能力的质变需要引入新要素。当前语言模型通过挖掘现有数据潜力仍能进步，但物理世界的开放性要求模型具备在线学习与自主演化能力。他透露，团队早在2020年就提出“物理智能”概念，试图构建可演化、可交互的智能体学习环境，这与当前“世界模型”的探索方向高度契合。

对于未来形态，朱军预测世界模型将走向多模态通用化，类似语言模型从专用到GPT的演进路径。他特别强调“有眼睛”的模型能力——通过视频数据理解物理世界状态，是构建世界模型的关键突破口。

罗福莉从实践路径补充道，语言模型与世界模型目前呈双轨并行态势，但语言模型因数据可解释性更强（代码环境可还原智能诞生场景），在Agent系统搭建与自我提升机制设计上更具优势。她认为，世界模型需优先突破高效世界模拟器的构建——当前视频生成模型在长程一致性上的不足，已成为制约技术发展的瓶颈。

朱军对此表示认同，他指出世界模型需具备三大核心能力：状态理解、预测想象、行动规划。从数据维度看，视频数据因其记录物理世界的丰富性，将成为模型训练的核心资源。他透露，团队正在探索将动作（Action）引入视频模型，这一方向已逐渐成为行业共识。

在技术优先级上，朱军认为应先提升模型智能水平，再通过模型压缩等技术实现轻量化部署。他总结道：“世界模型的复杂度更高、发展周期更长，但其探索空间与潜在价值同样巨大。这场重构世界的竞赛，才刚刚拉开序幕。”

点击展开全文