探秘北京人形机器人数据基地:机器人如何攻克“洗水果”难题?
2026-03-21 11:14:21未知 作者:徽声在线
记者观察:徽声在线记者|金晶
徽声在线记者|文姝琪
对于普通人来说,清洗4个水果可能只需短短1分钟,但在北京人形机器人创新中心的具身智能机器人数据与训练基地,这一简单任务对机器人而言却需要8分钟——而且这还是在人类操作员通过遥操作器精细控制下完成的。
然而,若想让机器人未来能够真正走进千家万户,独立完成洗水果等家务,海量重复性训练数据的积累与大模型的深度学习是必经之路。北京人形机器人创新中心的数据与训练基地,正围绕这一核心逻辑,探索数据采集、标注、质检的工业化流程,为机器人智能化提供关键支撑。
操作员通过遥操作器指导机器人完成洗水果任务
四天前,负责操控机器人洗水果的操作员收到了一份详细的任务文档。他需严格按照客户要求,在四个仿真水果表面涂抹模拟污渍,随后通过遥操作器控制机械臂完成一系列动作:拿起水果、打开水龙头、擦洗污渍、将水果放回篮中。只有四个水果全部清洗完毕,才算完成一遍训练流程。
遥操作器配备了两只机械臂,每只机械臂拥有六个关节,其中三个可横向移动,三个可纵向移动,与实际执行任务的机器人关节一一对应。尽管设计精密,但机械臂的灵活性仍不及人类关节,导致动作速度相对缓慢。
截至目前,该操作员已重复完成160遍任务,累计清洗了640个水果。而客户的要求是500遍,这意味着他还需至少保质保量地重复六天。这500条数据,旨在帮助大模型理解“洗净水果”的具体标准——不仅需要采集“清洗”动作的数据,还需通过机器人夹爪及顶端的摄像头,捕捉“干净”状态的视觉信息。此外,操作员需实时更换背景元素,如将洗手池上的清洁剂替换为洗洁精,或调整海绵擦与钢丝球的位置,以增强模型的泛化能力,确保机器人在不同场景下均能完成任务。
这只是北京人形机器人创新中心数据与训练基地的众多场景之一。基地还根据客户需求,搭建了家居、商超、办公、工业、医药、康养等30余个领域的应用场景。目前,120余台机器人正在人工操控下,以缓慢而精准的动作完成指定任务,如摆放水果、给婴儿更换尿布、整理工具箱、将矿泉水从冰箱搬运至收银台等。每个动作均需重复上百次,以确保数据质量。
机器人执行矿泉水搬运任务
人形机器人若想真正融入生活或工业场景,必须具备处理复杂物理世界的能力,这涉及视觉、力觉、触觉等多模态数据的整合。然而,当前机器人行业普遍面临训练数据不足的挑战。
“这就像教孩子学习——数据就是知识。”北京人形机器人创新中心具身数据负责人孔超向徽声在线解释道。数据与训练基地通过提供海量、多样、高质量的训练数据,为模型赋能,助力机器人更深入地理解人类世界。
北京人形机器人创新中心产品负责人、具身智能机器人数据与训练基地负责人蒋未来在接受徽声在线等媒体采访时透露,目前基地的主要客户为模型研发公司,客户会指定具体场景、任务及数据量。价格根据任务复杂度而定,简单操作每小时数据价格在百元级别,复杂任务则可达千元。
截至目前,该基地已累计交付近两万小时的训练数据。蒋未来观察到,2026年机器人行业对数据的需求将迎来爆发式增长:“当前市场上的订单或需求基本以十万甚至几十万小时为量级,较去年至少增长十倍。”
“但只有合格的数据才能称为知识。”孔超强调。以洗水果任务为例,若操作顺序错误、水果污渍未擦净或过程存在卡顿,该条数据将被视为无效。合格数据需满足多维度标准,简单来说,“越接近人类操作观感的数据质量越高”,蒋未来补充道。
为提升数据质量,基地针对不同任务类型制定了详细操作规范。例如,操作员上岗前需通过标准化动作考核,确保同一任务在不同时间、由不同人员执行时,采集到的动作轨迹高度一致;数据质检环节则要求动作完整、标注准确。只有通过全部质检的数据,才能进入算法训练流程。蒋未来透露,基地成立初期质检合格率不足50%,但目前已提升至95%以上。
然而,真机采集模式面临高昂的前期成本挑战。蒋未来指出,该模式需大量资金采购机器人设备,同时需考虑设备折旧、人员培训及场地搭建等持续投入。此外,从行业发展角度看,人形机器人数据领域尚未建立统一的确权、定价与交易规范,且采集数据与机器人硬件构型深度绑定——A机型采集的数据无法直接用于B机型训练,导致标准化数据交易市场难以形成,大量数据价值无法充分释放与流转。这套行业标准的统一与完善,仍需全行业在实践中逐步探索。
孔超在接受徽声在线采访时表示,当前基地内的数据采集仍类似于“实验室”环境,“若想真正达到人类智能水平,还需在真实环境中运行以提升泛化能力”。
但让机器人直接进入工厂或复杂真实环境存在较高风险。因此,孔超认为,无本体采集将成为未来机器人数据采集的主流趋势。该技术通过让人佩戴头环、手套等设备模拟机器人动作完成数据采集,再经算法优化形成可用数据。在市场需求的推动下,预计今年无本体技术将更加成熟。
