高盛深度调研中国机器人公司:进步显著,规模化仍需时日
2026-06-04 11:00:35未知 作者:徽声在线
在5月18日至22日期间,高盛分析师Jacqueline Du带领团队对中国14家机器人公司进行了密集调研。他们首先在香港Asia Communacopia + Technology大会上与部分企业进行了交流,随后连续三天在深圳和北京展开了深入的中国AI机器人探索之旅。
这14家被调研的公司涵盖了多个领域的代表性企业:从专注于触觉传感器研发的戴盟机器人,到设定了万台交付宏伟目标的优必选;从在3D视觉领域有所建树的梅卡曼德,到在RoboChallenge赛事中脱颖而出的千寻智能;还包括银河通用、星海图、极智嘉、逐际动力、灵心巧手、帕西尼、众擎机器人、越疆科技、埃斯顿以及自变量机器人等。
图丨相关调研报告(来源:Goldman Sachs)
在5月26日发布的调研报告中,高盛给出了一个既克制又明确的判断:中国机器人行业正稳步向商业化迈进,但投资者仍需保持耐心,等待行业的进一步成熟。
轮式机器人成为新宠
高盛在调研过程中发现了一个显著趋势:众多企业正倾向于选择轮式底盘搭配两到三指夹爪的机器人设计,而非传统的双足搭配五指灵巧手。
星海图管理层明确表示,轮式机器人配夹爪是当前更为合理的选择,能够覆盖约90%的工业应用场景。其VLA(视觉-语言-动作模型)的执行速度已达到人类的80%至90%。越疆科技则估计,工业需求中约50%可以通过机械臂解决,20%至30%依赖轮式人形机器人,而剩余的20%至30%才真正需要双足机器人。
持类似观点的公司不在少数。千寻智能也已将五指灵巧手排除在近期发展路线之外,理由是其寿命短、成本高。目前,三指夹爪正在测试中,即将投入实际数据采集。
然而,几乎没有哪家公司会公开否定双足机器人的终极价值。越疆称双足是“最终的最高泛化形态”,星海图也不排除未来研发双足机器人的可能性。但在2026年这个时间节点上,行业的重心仍然放在轮式机器人上。
与机器人形态选择同步变化的是模型架构。关于具身智能模型的讨论已不再局限于“VLA万能论”。VLA虽然负责策略生成和动作输出,但在独立运作时缺乏对执行后果的预判能力。高盛观察到,越来越多的公司正在将世界模型(World Model)作为VLA的功能性配合层,用于下一状态预测、动作提交前验证以及在不确定环境下增强鲁棒性。星海图、银河通用、千寻智能和众擎机器人都明确表达了这一发展方向。
卧安机器人5月21日发布的OneModel 1.7,采用了“潜在世界动作模型”(latent world action model),将世界模型的泛化能力和VLA的执行能力相结合,并加入了一个“成功记忆层”,用于回溯此前的成功执行经验。
千寻智能则选择了潜在预测路线,不做逐帧生成。其Spirit v1.5模型在今年1月开源后,在RoboChallenge的Table30上取得了66.09分和50.33%的成功率,成为首个超越Pi0.5的中国开源具身模型。
与此同时,模型规模也在不断扩大。高盛称,行业讨论已从此前单个几十亿参数级的预训练系统,转向40B到80B参数量级的多模态栈。但多家公司强调,这些更大规模的模型组合离部署级质量还有多轮迭代的距离。
另一个新兴趋势是触觉技术的融入。VTLA(视觉-触觉-语言-动作模型)正在成为部分公司的差异化发展方向。戴盟机器人的核心策略是研发触觉小模型,作为插件层接入其他VLA框架。帕西尼则计划下月发布一个以触觉为主导的VTLA模型,以补足视觉为主的方案。两家的判断一致:在物理交互质量要求高的场景中,光靠“看”是不够的,还需要“摸”。
数据成为关键入场券
如果只能从这份报告里挑选一个核心词,那无疑是“数据”。
高盛的判断非常明确:高质量、真实世界、多维度的数据仍然是实际部署的首要瓶颈。但讨论的焦点已经从笼统的“数据配方”,转向了“用什么架构规模化生产数据”。
当前,大致形成了两条数据生产路线。
一条是集中式数据工厂。帕西尼是最典型的代表,已经在天津、宿迁、武汉、自贡、赣州运营了5座数据采集工厂,各自对应着当地优势产业的数据类型,背后有地方政府的支持。
优必选的数据工厂模式则是:地方政府购买机器人并拥有数据所有权,企业通过补贴、硬件订单和数据使用权的组合获取回报。优必选预计,2025年人形机器人需求中约一半将来自数据工厂,管理层预计2026年这块需求将持平或更强。
另一条是分布式部署回流。星海图与亦庄政府合作,在“边工作边采集”模式下,以真实机器人遥操作为主,占数据组成的80%至90%;同时辅以UMI手套(通用操作接口)、外骨骼、第一人称视角等方式。公司已开源500小时内部数据并获得开发者社区认可,目标是今年将数据量扩展到100万小时。
千寻智能已经部署了800多台机器人,用于持续的远程监控式数据采集。部署用户还会产生付费数据回流。公司年底目标同样是累计100万小时真实数据,明年目标则是数千万小时。
戴盟机器人则走了一条更独特的路。其DM-EXton数据采集可穿戴设备通过运营商网点租出,用户在家采集数据,按每小时几十元计费。一旦实现大规模分发,目标是形成百万小时级数据集。
越疆科技则押注装机量的副产品逻辑:不做独立的数据采集业务,而是利用协作机器人出货建立的15大场景和广泛客户基础,在概念验证(POC)推进过程中同步积累真实工业场景数据,用存量客户理解驱动模型训练和场景泛化。
数据正在成为实际的收入来源。帕西尼的商业化重心就是数据和触觉传感器,其数据被用于训练约15个垂直模型、向大模型厂商出售以及为机器人应用定制数据集。在物流分拣场景中,帕西尼给出的引导是,约1亿到2亿个数据点就足以支撑部署,时间线短至1到2个月,目前已经在和京东合作推进。多家公司预计,2026年数据相关收入占比将上升。
商业化路径:多步漏斗与规模化挑战
高盛总结的商业化路径是一个多步漏斗:POC验证通常需要3到6个月,平均要做2到3轮;随后进入小批量测试阶段,通常每个工厂订单不超过50台;再经过约12个月的验证期;到试点部署阶段,订单规模才开始向每客户50到100台靠拢。
多数行业玩家认为,大规模部署要到2027到2029年才能实现,前提是在部署级模型之上积累数千万小时的高质量数据。
目前最接近规模化交付的是优必选。公司2026年目标约1万台,其中工业5000台,商业和家用5000台。汽车仍是最大的工业垂直场景。2025年下半年以来,一级汽配、半导体和3C的需求明显回暖,以上下料为主。
工业人形机器人的平均售价(ASP)从2025年的70万到80万元降至2026年引导的55万到65万元。物料成本(BOM)已经从2025年初的约40万元降至目前略高于20万元,近期目标是20万元,更长期目标是在2027年前后降至10万元。降本的主要驱动力是执行器和减速器的模块化放量以及结构件从数控机床(CNC)加工转向模具生产。前者占BOM约30%,后者占约50%。
越疆科技的具身AI相关收入2025年只占总营收的4%,但同比增长了4倍。人形机器人ASP在20万到50万元之间,均价约30万元,毛利率已经做到45%。2026年出货引导为300到500台。
千寻智能在宁德时代的电池检测场景上已经通过POC,并开始小批量采购。一台机器人替代一个工位,此前需要2到3个班次的人力。但管理层判断,真正的规模化要等产品标准化后才能实现,大概在2028年前后。当前模型在新任务上的成功率约40%到50%,管理层认为,60%到70%才是约束显著放松的门槛。
灵心巧手是另一个值得关注的样本。管理层称,其在高自由度灵巧手市场占据全球80%以上份额,是唯一实现月产1000台以上高自由度灵巧手的厂商,峰值产能达4000台,产品ASP比海外竞品低50%。
但在商业化策略上,灵心巧手故意避开了搬运、分拣这类同质化场景,押注长期高价值技能。其LinkerSkillNet平台拥有全球最大的真实世界灵巧操作数据集,覆盖超过500种技能。
在国内市场,软件和技能目前主要通过硬件捆绑销售实现变现,并加入技能溢价;美国客户则更接受按结果付费的租赁模式,回收期约6个月。管理层称,预计3到5年内能复刻所有人类精细操作。
众擎机器人则直接给出了一个消费端的成本锚点:3000美元BOM是家用场景大规模进入的关键门槛。Onero当前目标ASP约1万美元,为夹爪版本。降本路径是用软件算法补偿硬件精度不足,同时持续优化核心零部件。不过,家用场景在安全性和稳定性上的门槛远高于工业,管理层预期的消费端时间线是3年后。
高盛给这份报告起的副标题是“向商业化现实更进一步”。这个表述非常准确:行业确实在进步,但离真正的规模化交付还隔着好几年的POC和验证期。
在14家被调研的公司中,真正形成稳定订单规模的屈指可数,大部分还在POC和小批量测试之间反复。行业共识把大规模部署窗口锁定在2027到2029年,而这本身又建立在一个假设之上:到那时,数据量和模型质量能同时跨过某个临界点。
徽声在线今年初已经把2026年中国人形机器人销量预测从1.4万台上调至2.8万台。但这些数字里有多少是数据工厂采购,有多少是真正替代劳动力的工业订单,目前并不明了。
参考资料:
1.https://finance.biggo.com/news/NhwsY54BaoGGrU-I2QmE
运营/排版:何晨龙
注:封面/首图由AI辅助生成
