中国机器人模型崛起,引领全球新潮流

2026-04-23 12:27:04未知 作者:徽声在线



今年初,知名机器人行业权威媒体The Robot Report在发布的2026年行业趋势报告中指出,中国正与美国并肩引领物理AI的发展潮流,其独特的模型解决方案正推动人形机器人的广泛应用[1]。

仅仅两个月后,美中经济与安全审查委员会(USCC)便发布报告称,中国在顶尖AI模型性能上已取得显著进步。报告指出,中国正积极推动AI技术在机器人等领域的深度应用,由此产生的海量真实数据为模型的持续优化提供了有力支撑[2]。

这一转变标志着西方媒体与机构对中国机器人产业态度的微妙变化,从以往的质疑到如今的认可。

在西方语境中,中国常被描绘为“制造强国”,即便在全球人形机器人市场中占据主导地位,被反复提及的也往往是其硬件生产能力、供应链优势、效率及性价比。而“硬件依赖中国,模型依赖美国”的观点,在某种程度上成为了一种共识。

然而,随着人形机器人进入大规模商业化落地阶段,中国机器人公司的模型实力开始受到重新评估。

本月,具身智能领域的领军企业它石智航宣布完成4.55亿美元Pre-A轮融资,不仅刷新了中国具身智能领域的单轮融资纪录,还成为最大规模的Pre-A轮融资案例。成立仅一年,其累计公开融资额已达6.97亿美元,这一数字是当下行业领头羊、全球估值最高的机器人企业Figure AI首年融资额的近10倍。



与众多以跳舞、打拳为卖点的人形机器人不同,它石机器人凭借其卓越的模型能力脱颖而出,这正是吸引资本蜂拥而至的关键所在。

它石的成功,再次印证了中国机器人产业的新趋势:不仅硬件要强,模型更要出类拔萃。

探索新路径

时间回溯到一年前的特斯拉电话会议,马斯克在赞扬自家Optimus机器人世界领先的同时,也不忘提及“中国威胁论”,担心排名第二到第十的人形机器人公司均来自中国[3]。

马斯克的这番言论背后,隐藏着两层含义:一是中国公司凭借强大的硬件制造能力,有望占据人形机器人市场的大部分份额;二是即便如此,中国公司仍难以与特斯拉抗衡。

马斯克的信心来源于美国在模型领域的绝对优势。

从VLA到世界模型,美国始终引领着模型技术的最前沿发展。因此,即便硬件制造相对滞后,美国机器人仍被认为可以通过更智能的“大脑”对中国机器人实现降维打击。

实际上,硬件和模型是人形机器人的两大支柱,缺一不可。

人形机器人与传统工业机器人的核心区别在于其泛化和通用性。它们不仅要具备人类的手脚功能,还要能像人类一样完成各种复杂任务,如打螺丝、洗衣做饭等。硬件决定了机器人的行动力,而模型则决定了其通用性。


理想中的人形机器人应既能进厂打工又能在家做家务

硬件发展的瓶颈在于许多零部件需要“无中生有”,这恰好是中国零部件制造商的强项。因此,中国机器人常通过展示硬件性能来彰显实力。

而模型发展的难点则在于技术路线尚未明确,训练过程耗时且成本高昂,模型入端降本仍是一大挑战。这恰好是美国科学家的传统优势领域,因此美国机器人公司常将产品发布会办成学术研讨会。

对于大多数中国机器人公司而言,模型能力的不足已成为商业化进程中的一大障碍。中国机器人被诟病只能跳舞不能打工,并非主观上不愿意,而是客观上“大脑”还不够聪明。

目前,人形机器人模型的主流技术路线主要有三种:

第一种是以特斯拉为代表的自动驾驶迁移路线,该路线试图将自动驾驶能力直接应用于机器人领域。例如,特斯拉直接复用其FSD视觉算法和占用网络(Occupancy Network),使机器人具备类似汽车的3D空间建模能力;


Optimus机器人直接采用了特斯拉的FSD模型

第二种是以Figure AI的Helix系统为代表的VLA端到端路线,该路线主张将机器人的感知、思考与行动集成在同一个大模型中。搭载这类模型的机器人具备极强的常识推理能力,如当你对它说“我饿了”,它就会直接找食物并递给你。

第三种是许多主流中国机器人公司采用的“大脑+小脑模式”,即利用大语言或视觉模型来拆解任务,再通过强化学习或传统控制理论来完成任务。

前两种路径虽被产业寄予厚望,但在实际操作中却暴露出诸多问题。

例如,特斯拉的“平移”路线需要大量的适配与再验证工作。具身智能的复杂性远超自动驾驶,模型无法直接适用,导致Optimus量产计划一再推迟。据称,目前Optimus仅能完成搬运、装配等简单操作,距离真正替代人类工人还有很长的路要走。

Figure AI的VLA路线则存在“动作跟不上大脑”的问题。虽然机器人具备强大的推理能力,但在产线上却因推理延迟而无法实现亚毫米级的精细化实时反馈,难以胜任精细工作。

此外,该路线还极度依赖特定场景的预训练视频。一旦工厂环境、光照或零件色差发生微小变化,机器人就容易发生“逻辑死机”。而真实产业场景恰恰复杂多变、容错率低,因此跨产线工作的通用泛化能力与稳定工作能力培养难度极大,短时间难以在复杂的工业实战中落地。

国内主流的“大脑+小脑”路线则存在先天不足,“大脑”和“小脑”的割裂导致无法实现高精度操作,这也是大部分中国机器人无法进场拧螺丝的主要原因。

中美双方在人形机器人领域各有侧重,一个专注于硬件开发,一个致力于模型研究。然而,模型的发展速度却远远跟不上硬件的步伐。当中国供应链开始降低硬件成本时,模型的进步却仍停留在论文和PPT阶段,这严重制约了商业化的进程。

在此背景下,中美双方都在期待和竞争一个新的路径出现。而这次,中国率先迈出了关键一步。

数据为王的时代

3月举行的全球三大家电及消费电子展之一AWE上,人形机器人成为了焦点。

与众多以跳舞、打拳为卖点的机器人相比,它石智航的展台显得格外务实。其机器人A1没有花哨的表演,却以一小时百余次的速度创造了“机器人在一小时内装配亚毫米级线束最多次数”的吉尼斯世界纪录。


吉尼斯世界纪录颁奖现场,A1机器人创造了新的世界纪录

这一幕的含金量,对于身处一线的自动化工程师和工人们来说,无疑具有重大意义。

线束装配不同于刚性零件的装配,它涉及弯曲、晃动、变形等复杂因素。机器人必须在每一毫秒实时感知线束的细微形态变化并做出亚毫米级的动作补偿,这被认为是工业自动化领域的“哥德巴赫猜想”级难题。

攻克线束装配难题,不仅使它石A1与仍在工厂从事搬运分拣工作的机器人们拉开了差距,也将其模型能力提升到了一个新的高度。

它石智航虽然成立时间不长,但在成立后的三个月内就完成了2.42亿美元的天使轮融资,打破了中国具身智能领域的天使轮融资纪录。

它石的创始人兼CEO陈亦伦和董事长李震宇均为国内自动驾驶领域的领军人物,名声在外。首席科学家丁文超和首席架构师陈同庆同样拥有深厚的产业背景,主导过众多知名自动驾驶项目。

自动驾驶被视为人形机器人的前置产业和子命题,因此技术团队的自动驾驶经验在很大程度上决定了技术的深度和广度。特斯拉最早的Optimus团队工程师就大多来自汽车产业链。

正是这样的团队组合,使它石在纷繁的技术路径和产业杂音中找到了突破口。

它石提出的方法是直接与真实世界对齐,创新打造“数据、模型和物理硬件三位一体”的解决方案。其核心逻辑是以真实世界数据驱动研发世界模型。这一路径在当时并不主流,甚至因难度极大、见效极慢而被视为吃力不讨好。然而,它却是通向通用智能最直接的一条路径。

为此,它石首创了Human-centric数据采集新范式,实现了真实世界具身数据获取能力的跨越式突破,精准锁定了当下行业痛点——数据。


它石“三位一体”方案示意图

在模型训练领域,数据的重要性不言而喻。机器人们之所以迟迟无法进厂打工,原因就在于用于模型训练的数据规模不够大、不够真实、也不够可靠。

相较于大语言模型可以依赖网络上现有的图文数据,机器人需要与真实的物理世界交互,需要大量“第一人称数据”,包括视觉感知数据、运动控制数据、物理反馈数据等。

这些数据无法从网上获取,需要在真实场景中通过实操来积累。这是一个从0到1的工程,难度极大。

放眼全球,即使家大业大如特斯拉,除了生搬自驾数据外,早期也主要依靠遥操作获取数据。人类操作员穿上特制设备远程驱动机器人动作,机器人身上的传感器记录力觉、触觉、空间感等各个维度数据。然而,这种方法不仅费人费钱,而且由于机器人机械结构的局限性,采集到的数据是人类为了适应机器人而变形的动作,导致训练出来的机器人动作流利度远低于人类正常水平。


人类操作员通过遥操作“教”机器人做动作

Figure AI除了遥操作外,还收集了大量人类第一视角视频让机器人“边看边学”。然而,学习效率却取决于机器人本身的智力水平。就像都是看网课学习,学霸和学渣的效果截然不同。而且,这种方法只有视觉没有触觉,数据不够全面。

综合现有方案,不是成本高昂就是数据不够可靠。而它石的Human-centric范式最大改进就是提高了数据收集的真实性和可操作性:

人类操作员穿戴它石自研的SenseHub套件在真实场景中干活,由套件中的传感器记录数据。这些数据记录了人类肢体最自然的加速度、抓取力和空间轨迹,没有经过机器人硬件的“污染”,保留了动作的原生高频细节。

SenseHub套件包括TARS Glove(高精度动捕手套)和 TARS Vision(第一视角感知相机),轻巧易穿戴,主打随时随地采集数据。




人类操作员穿戴SenseHub套件做指定动作收集数据

由于不需要机器人配合,这种模式可以利用人海战术进行大规模并行采集,且成本大幅下降。根据机构测算,其成本预估比传统的真机遥操作低10-20倍。而中国恰恰具备超大规模的应用场景与极高的任务多样性,为这种数据采集方式提供了得天独厚的条件。

通过提高数据的纯净度和数据采集的效率,它石Human-centric范式解决的是当下机器人行业普遍存在的商业化“拖延症”,也为机器人的大规模落地提供了弯道超车的新路径。

在上述数据范式下,它石收获了实打实的模型成果与巨大的应用潜力。

2026年3月,它石发布的通用具身大模型AWE3.0在延续全身端到端学习、动态时空推理等既有优势基础上,实现了三项关键性的技术创新:全视角通感决策(OSD)、高密度触觉感知(HTS)、隐空间丝滑动作(LAS)。这些创新可大幅提升机器人在新视角下的任务成功率、对局部触觉的灵敏感知与精细响应能力,并降低任务抖动率。

而世界级的纪录印证,也只是它石模型能力的一隅体现。


它石智航吉尼斯世界纪录挑战现场

渐进式与跨越式的较量

高新技术从开发到大规模落地,总要经历一个阵痛期。在这个阶段,不同的技术路径之间会反复试错,然后慢慢靠近商业化爆发的奇点。

人形机器人正在经历的便是这样的阵痛期。技术路径尚未收敛,每一条看似光明的大路前方实则大雾弥漫。这个阶段,考验的与其说是谁的技术路线更高级,不如说是谁更能承受住试错的风险,活着走到大雾飘散的时刻。

上一个接受考验的是人形机器人的“前辈”——自动驾驶汽车。

与当前人形机器人厂商繁杂的技术路线类似,最早一批自动驾驶开发者同样面对几条不同的发展路径。最具代表性的是“跨越式”和“渐进式”。

“跨越式”优等生如Waymo、Cruise等,其核心逻辑是直接研发L4级自动驾驶技术,不依赖人类监管,在特定区域进行商业化测试。“渐进式”代表如特斯拉、小鹏等,则先量产L2/L2+自动驾驶汽车,再利用海量用户行驶数据反哺算法,逐步提升自动化等级。

这种直捣黄龙的激进路线最初是大部分参与者的选择。然而,当时开发出来的L4车辆成本高达20万美元,而且由于测试周期漫长导致商业化举步维艰。企业不得不重资产运营、负债前行。

与之对应的是“渐进式”路线主打“先上路、再进步”。最典型的代表就是特斯拉,其核心逻辑是先实现L2/L2+自动驾驶功能,再逐步提升自动化等级。本质是保证了企业能活下来,再在技术上循序渐进,通过真实的驾驶数据解决一个个corner case,进而反哺模型能力。

过去的几年里,跨越式的队伍随时有人倒下,逐渐人丁稀少。反倒是渐进式的队伍不断壮大。大模型时代来临后,特斯拉也是最早调转船头、吃到大模型红利的车企。

如今的人形机器人领域,类似跨越式和渐进式之争已经露出苗头。

Figure AI的技术路线就类似于跨越式,即一开始就追求通用化的极致、全场景的覆盖。

Figure AI试图让机器人通过“看视频”自学,相当于让自动驾驶汽车上来就完全摆脱高精地图、纯靠算法感知世界。然而,人形机器人需要的不只是智商,还有“行动力”。博士生进厂打工可能不如一个高中毕业的熟练工。没有足够的真实、精准针对特定场景且有效数据的积累,机器人再聪明也拧不了一颗螺丝钉。

这种情况下,量产无限期拖延或是实际能力不符合预期也无可厚非。但投资人的钱总有烧干的一天。要等到技术完美再大规模量产,大概率会步入自动驾驶“跨越式先烈”的后尘。

它石走的就是类似于“渐进式”的路线,即先从特定场景出发,先学会人类最精细的动作,再谈泛化。其解决方案围绕“效率至上、落地应用为先”的策略展开。

Human-centric范式的最大突破就是摆脱了“先造出高精度的机器人、再采集数据”的桎梏。通过自研SenseHub套件,人类操作员可以随时在产线上作业采集数据,使得其大模型能够快速进化更新,与硬件共同进步,构建起一个相互赋能的闭环,进而快速跑通具身智能的scaling law。


它石A1机器人产线多机协同作业

同时,数采成本降低至遥操作的1/10到1/20,意味着同等资本投入下,能够覆盖的场景深度(如从简单的抓取到复杂的精密装配)和广度是竞争对手的数十倍。

这种商业和技术的平衡使得它石能够保证技术持续提升的同时,确保量产和商业化的节奏,及时“造血输血”。这也是为什么在机器人公司扎堆的情况下,“来得晚”的它石反而获得资本的青睐。

活下去,其实是每个科技创业公司最稀缺、也是最宝贵的能力。

它石的Pre-A融资由高瓴资本与红杉中国两大顶级资本首次在具身智能赛道联合领投。本轮后它石已然跻身国内人形机器人的第一梯队。

但这远未达到它石的巅峰。

将视线拉向全球,中美机器人公司估值的鸿沟显而易见:Figure AI背靠OpenAI,短短两年内身价突破390亿美元(约合人民币2700多亿元);特斯拉Optimus量产日程一拖再拖,也不妨碍资本将其隐形估值锚定在千亿美元上下。

这种落差并非技术的代差所致,而是刻板印象的投资语境下资本与技术实力的错配。

当顶着光环的明星企业还在为如何走出实验室、克服落地延迟而焦虑时,它石已经靠着更低的数据成本、更大的数据规模、更真实的物理世界数据和更精准务实的模型在工业落地的深水区实现了局部战场的技术反超。

某种意义上,如今的它石正伫立于极具性价比的爆发前夜。随着其机器人在真实产线上展现出越来越强大的韧性,眼下的估值鸿沟终将被填平,同时迎来价值的真正重估。

写在最后

今年年初的特斯拉电话会议上,马斯克老生常谈,再次对中国人形机器人公司大夸特夸。而这次夸的不只是中国的硬件实力,还称中国的模型“也相当不错”。

看着中国人形机器人在模型端的超预期进步,美国的“特斯拉们”确实该紧张了。





[1] Chinese robotics outlook 2026,The Robot Report

[2] China’s open-source dominance threatens US AI lead, US advisory body warns, Rueters

[3] Elon Musk worries Chinese companies will fill out the world’s top 10 robot makers—but claims Tesla is, and will stay, No. 1,Fortune

[4] 中国机器人在跳舞,美国机器人在发论文,徽声在线

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
中国机器人模型崛起,引领全球新潮流中国机器人模型崛起,引领全球新潮流 AI工程化革命:阿里腾讯字节重构产业技术范式AI工程化革命:阿里腾讯字节重构产业技术范式 中国科学院黑磷快充电池技术获突破,引领新能源革命中国科学院黑磷快充电池技术获突破,引领新能源革命 乒坛新“阿尔法狗”诞生?索尼AI机器人Ace击败职业选手 登上《自然》期刊乒坛新“阿尔法狗”诞生?索尼AI机器人Ace击败职业选手 登上《自然》期刊 全新平台重磅上线!600余项检测助力新能源汽车电安全全新平台重磅上线!600余项检测助力新能源汽车电安全 俞敏洪再启南极计划:10名会员将获邀,去年全员信争议余波未平俞敏洪再启南极计划:10名会员将获邀,去年全员信争议余波未平