营收激增三倍、授权收入暴涨42倍:Momenta引领物理AI新纪元
2026-06-24 14:08:47未知 作者:徽声在线
营收激增三倍、授权收入暴涨42倍:Momenta引领物理AI新纪元
在过去的三年里,全球科技行业的焦点几乎都汇聚于一个关键词——大模型。然而,随着时光流转至2026年,一个崭新的概念——物理AI(Physical AI),正逐渐崭露头角,成为科技巨头们竞相追逐的新方向。
大模型的诞生,以GPT为代表,让人们首次领略到AI掌握语言规律与人类常识后的惊人能力跃迁。短短数年间,搜索、编程、办公、内容创作等领域均被其深刻重塑。
但越来越多的人开始意识到,这或许仅仅是冰山一角。人类的大部分经济活动,并非发生在虚拟的数字世界,而是扎根于真实的物理世界之中。
驾驶、物流、制造、零售、家庭服务、工业生产……这些构成全球经济基石的活动,无一不依赖于现实世界的交互。因此,下一代人工智能的竞争焦点——理解世界,已然成为巨头们必争的战略高地。
英伟达的黄仁勋将物理AI视为下一个重大产业机遇;特斯拉则将自动驾驶视为通往通用机器人与现实世界智能的桥梁;OpenAI也在积极探索能够理解和操作真实世界的Agent系统。
它们都在试图解答一个核心问题:当AI走出屏幕,如何理解这个充满物理规律、因果关系与不确定性的世界?
答案逐渐明朗,且指向了一个全新的基础模型范式——世界模型(World Model)。
6月23日,Momenta在港交所发布了聆讯后的资料集,正式迈入IPO冲刺阶段。两个月前,其R7世界模型刚刚实现量产首发,标志着世界模型首次拥有了被资本市场公开定价的商业标的,自动驾驶也迎来了新的价值重估时刻。
当AI开始理解世界
要深入理解世界模型与Momenta R7,我们需先回顾ChatGPT的成功之道。
大语言模型的核心在于“预测”,它通过海量互联网文本学习语言规律与人类常识,进而预测“下一个词”,实现推理、总结与创作,甚至接近人类的认知能力。
然而,物理AI需要的是另一种预测:下一秒,世界将如何演变?
比如,苹果的自由落体运动轨迹;又如,一辆车在十字路口遭遇前车突然减速、行人闯红灯、自行车偏离路线等复杂情况。
世界模型需要预测的是:谁将移动?朝哪个方向移动?哪些行为将带来风险?自己的下一步动作将如何改变整个环境?
如果说大语言模型掌握的是语言世界的规律,那么世界模型则掌握的是物理世界的规律。
它不仅需要了解发生了什么,更要能够推演为何发生以及接下来可能发生什么。因此,它被视为物理AI时代的Foundation Model,掌握世界模型,AI才真正具备了“物理常识”。这也被众多业内人士视为物理AI的“GPT时刻”。
Momenta R7的三层架构,完美对应了物理AI从“认知”到“训练”再到“进化”的全过程。
第一层,世界模型预训练(World Model Pre-training)。为AI构建物理世界的基础常识体系。
Momenta基于超过120亿公里的真实驾驶里程,从海量场景中提炼出约1亿段黄金数据,通过视频预测与因果学习,将现实世界的常识融入模型之中。
第二层,世界模型仿真(World Model Simulation)。现实世界的危险场景往往较为罕见,如连续碰撞、极端天气、复杂施工等长尾场景,单纯依靠路测难以全面覆盖。世界模型能够在数字世界中生成近乎无限的训练环境,让AI反复演练。而且,Momenta的仿真并非纯粹渲染生成,而是通过真实数据学习世界演化规律,再用实车数据进行校准,从而缩小“仿真与现实”之间的差距。
第三层,世界模型中的强化学习(World Model Reinforcement Learning)。这与大模型的强化学习逻辑相似,模型在虚拟世界中不断试错,系统根据结果给予奖励或惩罚。经过数百万次迭代后,模型逐渐学会更安全、更高效、更接近人类驾驶行为的方式。
以一个具体场景为例,如果前车掉落一箱苹果,R7能够预判苹果滚落的轨迹与扩散范围,提前平稳减速避让,这便是世界模型的理解能力在发挥作用。
为了支撑这套三层架构的高效运行,Momenta进行了高强度的持续研发投入。招股书显示,Momenta在2025年的全年研发投入高达18.69亿元,占年度收入的77.5%,近三年累计研发投入更是达到了46.6亿元。截至2025年底,公司拥有研发人员1157名,占比近82%,其中超过三分之二拥有硕士及以上学历。
这使得Momenta成为全球首个实现无图城市NOA全国覆盖、首个实现端到端大模型量产、首个实现强化学习量产的第三方智驾公司,R7世界模型也是行业首个量产落地的项目。
为何自动驾驶成为物理AI的突破口
回望过去,为何物理AI率先在自动驾驶行业取得突破,而非机器人领域?
答案在于数据与商业规模的优势。
数字AI之所以能够迅速崛起,得益于互联网已经积累了海量文本数据。而物理AI则需要另一种关键资源——真实世界的交互数据。
具身智能行业目前仍面临一个根本性难题:真实交互数据匮乏。绝大多数机器人公司的部署规模仍然有限,一家公司可能只有几百台或几千台机器人在运行,数据规模不足,模型难以形成真正的Scaling效应。
但自动驾驶领域则截然不同。路上行驶的每一辆智能汽车都是一台移动的机器人,同时也是一台天然的物理世界数据采集器。
行人横穿马路、暴雨拥堵、临时施工改道、外卖骑手逆行、人车混行……这些长尾与泛化数据比互联网文本更难获取,同时也更具价值。路上的汽车每天都在记录真实世界的运行状态。
目前,搭载Momenta系统的量产车辆已超过90万台,累计定点车型超过210款。2022年,Momenta交付首个10万辆量产车耗时两年,而如今完成10万辆交付最快已不到40天。
这种加速趋势意味着数据飞轮已经全面转动起来。徽声在线CIC灼识咨询的数据显示,中国城市NOA解决方案的渗透率预计将从2025年的11%飙升至2030年的62%。在增量市场爆发之际,市场份额向头部企业聚集,2025年3月至2026年2月,Momenta在中国第三方城市NOA市场的销量市占率达到了65%。
从某种意义上说,自动驾驶是全球唯一同时实现了数据Scaling与商业Scaling的物理AI场景。这也是为何物理AI的“GPT时刻”可能最先在自动驾驶领域到来。
为何Momenta能够成为物理AI第一股
任何基础模型的竞争,最终都要回归到模型、数据与资本这三个核心维度。在这三个方面,企业之间的差距正在迅速拉大。
首先是数据壁垒。自动驾驶与大语言模型一样,都遵循规模定律(Scaling Law),数据量越大,模型性能越优越。这意味着,先积累数据的企业将拥有巨大的先发优势。
截至目前,Momenta已经积累了超过120亿公里的实车里程,并在中国第三方城市NOA市场占据了约65%的份额。数据飞轮已经开始形成良性循环:更多车辆带来更多数据,更多数据训练出更强模型,更强模型又吸引更多合作伙伴,这种正反馈机制与大模型时代如出一辙。
其次是商业闭环。物理AI的研发成本远高于数字AI,训练通用物理AI所需的投入可能达到百亿乃至千亿美元级别。没有稳定的现金流支持,绝大多数企业将难以坚持到技术成熟的那一天。
Momenta CEO曹旭东曾提出“门票理论”。他认为,要实现通用物理AI,必须拥有巨量现金流业务作为支撑。而Momenta的“飞轮两条腿”战略,正是由L2++业务提供数据与现金流支持,同时L4自动驾驶与未来物理AI则持续拉高技术天花板。
招股书显示,Momenta近三年的营收实现了跨越式增长:从2023年的7.43亿元增长至2025年的24.13亿元,三年翻三倍,年均复合增长率超过80%。截至2025年底,公司现金储备超过100亿元。
一个值得关注的数字是:其许可收入从2023年的0.23亿元增长至2025年的9.68亿元,翻了42倍。许可收入“高边际收益”的特性意味着后续增长的弹性将越来越大。
此外,Momenta的股东阵容极为豪华,汇聚了全球最核心的产业与科技战略投资人以及顶级财务投资人。产业资本囊括了全球汽车产业链的核心玩家,包括上汽、通用、奔驰、丰田、比亚迪、现代、奇瑞等7家全球顶级车企,以及博世、德赛西威、立讯精密等头部产业链合作伙伴和Uber、Grab、Stone Venture等Robo合作伙伴。科技巨头则包括腾讯、阿里云、蚂蚁集团、京东等。财务投资人更是覆盖了淡马锡、IDG、阿曼投资局、亦庄国投、Granite Asia、顺为、蔚来资本、凯辉基金、云锋基金、蓝湖资本、创新工场、真格基金、鼎晖投资、高榕创投、高成资本、众为资本、愉悦资本、钟鼎资本、盈峰资本、招银国际、华泰创新资本、混沌资本、春华资本、大湾区基金、国新基金、光合创投、九合创投、锦秋基金等全球最顶尖的投资机构。如此超豪华、多元化的股东阵营不仅为Momenta提供了战略与资本支持,还从业务协同、用户增长和全球化布局等方面助力了Momenta的高速增长。
最后,是世界模型带来的技术代差。这里有一个关键的技术判断:Momenta使用世界模型的方式与行业主流存在本质区别。
业内普遍做法是将世界模型作为一个“仿真工具”,先用其生成虚拟数据,再去训练或测试一个独立的主模型。但Momenta则试图让世界模型直接成为基座模型的一部分。
这种代差使得世界模型从一个“辅助工具”转变为一个“超级放大器”。系统的产品性能与能力上限可能不是10%的提升,而是10倍甚至100倍的代际差距。R7之所以能在短时间内快速进化,核心正在于此。
物理AI第一股即将诞生
自动驾驶仅仅是起点,真正让资本市场兴奋的并非城市NOA本身,而是世界模型所带来的泛化能力。
物理规律具有通用性,汽车、Robotaxi、物流车、人形机器人本质上都生活在同一个物理世界之中。只要模型学会理解空间、预测运动、推理因果关系,原则上它可以驱动任何需要与物理世界交互的载体。
Momenta正在将这一逻辑付诸实践。其采用同一套底层技术架构All-in-One Platform同时覆盖四条业务线:乘用车量产智驾、Robotaxi(无人出租车)、Robovan(无人物流车)、Robotruck(无人卡车)。底层技术的跨场景复用极大地摊销了多业务线的研发成本。
徽声在线CIC灼识咨询的数据显示,到2030年,仅Robotaxi、Robovan和Robotruck三个市场的全球规模合计就将达到约2000亿美元。
在全球化布局方面,Momenta的量产方案已在亚洲、欧洲、大洋洲、拉美和北非的10多个国家和地区落地实施。Robotaxi已与Uber、Grab、Lumo、享道出行等全球出行平台以及梅赛德斯-奔驰等车企建立合作关系,目前已落地亚洲、欧洲和中东地区。
未来,其同一套底层系统架构还有可能延伸至具身智能等领域,边际成本将迅速下降,而商业空间则将呈指数级扩大。
Granite Asia高级管理合伙人李宏玮表示:Momenta在全球率先采用“两条腿”策略,基于“数据飞轮”技术洞察,将量产辅助驾驶(Mass Production)与自动驾驶(Scalable Robo)并行推进,以世界模型为基座,让物理AI从技术理念走向现实生活。随着公司迈向公开市场,其在数据规模、算法壁垒和全球化商业拓展上的绝对优势正在形成不可替代的竞争护城河,这也为其未来的估值空间打开了极具想象力的上限。我们对Momenta长期的成长性充满信心。
要深入理解Momenta当前的商业路径,或许可以参照两家公司的模式。
一是“不造车的特斯拉”。两者都采用端到端架构、无图模式、世界模型、强化学习等技术路径,与Momenta高度趋同。两者都坚持用L2++量产车采集海量真实数据,再不断逼近L4级能力。
不同的是,特斯拉选择造车,而Momenta则专注于智驾平台。截至目前,Momenta已与全球前10大车企中的9家建立合作关系。以奔驰为例,从2017年投资Momenta到2025年底量产落地历时8年,但一旦突破便势不可挡,2024年Momenta已拿下了奔驰所有电车和油车的智驾业务。
二是“物理世界的Anthropic”。Anthropic不做硬件、不做消费端产品,通过Claude模型率先在软件编程领域跑通了商业闭环,再逐步向金融、医疗、法律等领域扩展。Momenta的路径与之类似,以L2++量产智驾完成数据和现金流积累后,再将技术优势快速泛化到Robotaxi、Robovan、Robotruck等更广泛的物理AI场景。
如果这个类比成立的话,那么Momenta的终局定位将不再仅仅是一家“智驾供应商”,而是物理AI时代的Android——一个开放的、平台级的操作系统提供商。
曹旭东有一个判断:“任何一个人工智能应用,一旦接近人类的水平,就会在很短的时间内大幅超过人类的水平。”这句话如果适用于自动驾驶领域的话,那就意味着前面十年、二十年的爬坡可能仅仅是个开始,真正的爆发可能发生在一两年之内。
从这个角度看的话,Momenta的上市其意义在于资本市场第一次为“物理AI基座模型”标出了价格。
ChatGPT之后,下一个改变世界的AI革命将发生在哪里?答案已经开始逐渐浮现。


