AI进化论:语言模型与世界模型如何重构未来?罗福莉、朱军等顶尖学者深度解析
2026-06-13 11:03:43未知 作者:徽声在线
随着AI coding技术突破关键临界点,智能体(Agent)的自我进化能力显著增强,“AI自主创造AI”的愿景正从概念走向现实。这一变革不仅重塑了技术边界,更预示着数字与物理世界的深度融合即将进入全新阶段。
6月12日,第八届“北京智源大会”开幕式圆桌论坛上,在智源研究院院长王仲远的主持下,小米MiMo大模型负责人罗福莉、清华大学教授兼生数科技创始人朱军、清华大学教授兼面壁智能首席科学家刘知远、南洋理工大学校长讲席教授安波四位顶尖学者,以“重构世界”为主题展开深度对话。这场汇聚产学研前沿力量的讨论,揭示了大模型技术从实验室走向产业化的关键路径。
作为长期深耕大模型研发的一线专家,四位嘉宾从模型能力跃迁切入,延伸至语言模型与世界模型的技术路线之争、递归式自我改进的实践进展,以及AI自进化是否已突破临界点等核心命题。当AI从“执行工具”进化为“创造智能的智能”,数字世界与物理世界的重构将呈现何种轨迹?哪条技术路线能率先实现突破?以下为根据对话实录整理的深度解析(内容经徽声在线编辑优化):
Anthropic新模型:技术跃迁的中间站还是质变起点?
罗福莉从技术架构角度解析称,Fable 5(Anthropic新模型)本质上是科学化Scaling(规模扩张)的阶段性成果。其参数量级预计达到当前最强开源模型的数倍,体现在三个维度:预训练数据规模的指数级增长、合成数据(AI与人类协作生成)的深度应用,以及测试时规模扩展(test-time Scaling)与强化学习的协同优化。这种多维度的外延拓展,使其成为模型能力进化的重要里程碑。
她特别指出,数据形态的变革具有划时代意义——从互联网文本数据到人机协同的合成数据,标志着模型训练正式进入“智能体时代”。这种转变不仅提升了数据量级,更重构了数据生成逻辑,为模型理解复杂场景提供了新范式。
朱军从应用效果维度补充道,模型规模与数据的协同扩张已带来显著性能提升。在物理世界模拟领域,过去两年间模型从产生“幻觉”到生成影视级专业内容,技术突破有目共睹。他强调,这种进步源于模型精细化程度的提升:数据质量优化、训练规模扩大、算法架构创新三者缺一不可。
面对物理规律学习的争议,朱军认为基础模型的显著进步已为逻辑推理、物理建模等任务奠定基础。他以多任务处理为例,指出新版本模型在Token消耗量上的优化(较前代减少30%-50%),证明智能体正朝着更高效的工具调用与决策方向演进。
AI自进化:概念热潮还是技术革命?
安波从技术演进逻辑出发,认为“自演化”概念虽火爆,但当前智能体仍处于初级阶段。他预测,未来真正颠覆性的突破将发生在工业垂直领域——当通用能力与行业知识深度融合,AI解决实际问题的潜力将得到彻底释放。这种“垂直化落地”趋势,正是技术从实验室走向产业化的必经之路。
罗福莉通过科研流程类比,揭示了模型能力边界的扩展。她指出,顶尖模型已从“完美执行指令”进化到“设计实验流程、验证结果准确性”,但在“提出假设”这一创造性环节仍存在差距。这种差距本质上是人类研究审美(taste)与判断力的体现,但递归自我提升系统的引入正在缩小这一鸿沟。
刘知远从科技革命视角提供宏观框架:他将“智能革命”类比工业革命,强调用AI替代重复脑力劳动的必然性。他预测,AI制造AI将成为高级智能的标志性能力,其发展速度可能远超工业革命(工业革命耗时数百年,而AI制造AI仅需数年)。但他同时警示,技术发展需坚守人类主体性——AI的终极目标应是服务社会,而非替代人类决策。
语言模型与世界模型:双轨并行还是此消彼长?
朱军从信息论角度解析模型进化逻辑:系统能力的质变需要引入新要素。当前语言模型通过挖掘现有数据潜力仍能进步,但物理世界的开放性要求模型具备在线学习与自主演化能力。他透露,团队早在2020年就提出“物理智能”概念,试图构建可演化、可交互的智能体学习环境,这与当前“世界模型”的探索方向高度契合。
对于未来形态,朱军预测世界模型将走向多模态通用化,类似语言模型从专用到GPT的演进路径。他特别强调“有眼睛”的模型能力——通过视频数据理解物理世界状态,是构建世界模型的关键突破口。
罗福莉从实践路径补充道,语言模型与世界模型目前呈双轨并行态势,但语言模型因数据可解释性更强(代码环境可还原智能诞生场景),在Agent系统搭建与自我提升机制设计上更具优势。她认为,世界模型需优先突破高效世界模拟器的构建——当前视频生成模型在长程一致性上的不足,已成为制约技术发展的瓶颈。
朱军对此表示认同,他指出世界模型需具备三大核心能力:状态理解、预测想象、行动规划。从数据维度看,视频数据因其记录物理世界的丰富性,将成为模型训练的核心资源。他透露,团队正在探索将动作(Action)引入视频模型,这一方向已逐渐成为行业共识。
在技术优先级上,朱军认为应先提升模型智能水平,再通过模型压缩等技术实现轻量化部署。他总结道:“世界模型的复杂度更高、发展周期更长,但其探索空间与潜在价值同样巨大。这场重构世界的竞赛,才刚刚拉开序幕。”

