探秘京东机器人数采中心:宝妈工人齐参与,数据助力AI闯入现实世界

2026-05-22 04:07:57未知 作者:徽声在线

五月的宿迁,尽管室外温度尚未攀升至酷热,但那座规模不大的制衣厂厂房内,却因机器的运转和工人们的忙碌而显得颇为闷热。工人们正争分夺秒地赶制新一批货物,其中几位工人头上佩戴着统一的黑色设备,这并非普通的装饰,而是用于采集训练具身智能模型数据的专业仪器。这些数据经过上传、细致清洗、严格质检、精准标注等一系列流程后,将被输入到具身智能模型中,助力模型更加深入地理解真实的物理世界。


图:工人佩戴数据采集设备专注工作,来源:徽声在线记者 王郁彪 摄

今年年初,京东曾对外宣布,将动员内部超过10万名各类职业员工,以及外部最多可达50万名的各行业人员,同时在宿迁发动超过10万名市民,共同参与到具身智能数据采集的宏大计划中。京东希望能在两年内积累超过1000万小时的人类真实场景视频数据,为具身智能的发展奠定坚实基础。5月20日,一个振奋人心的消息传来,京东宣布全国首个具身智能数据采集社区已在宿迁正式投入运行。

对于制衣厂的工人们而言,数据采集工作相对轻松,且还能为他们带来一定的额外收入。在宿迁,除了制衣厂工人,宝妈等居家群体也成为了数采工作的主力军。她们每日的任务是完成6个小时的数据采集,通过记录日常做家务的动作,为具身智能模型提供宝贵数据。整体而言,她们每月的收入在3000元到3500元之间,既照顾了家庭,又实现了经济独立。

机器人若想真正实现产业化,其“大脑”——即负责感知、决策和执行的核心部分,能力的突破至关重要,这已成为行业内的普遍共识。然而,“大脑”的训练需要海量的数据作为支撑,就如同建造高楼大厦需要无数的砖块一样。为了具身智能数据大厦的顺利落成,已经有人开始默默“造砖”,为这一宏伟目标贡献力量。

具身智能数采深入社区,采集人员月入可观

具身数据采集社区坐落于宿迁市湖滨新区,自今年4月试运行以来,便吸引了众多社区居民的积极参与。《徽声在线》记者实地探访发现,采集员们在经过专业技术人员培训后,便能在日常家务过程中轻松完成数据采集工作,既不影响正常生活,又能为科技发展贡献力量。

在正常进行擦桌子、叠衣服、整理收纳、地面清洁等家务劳动时,采集员们只需头戴京东自研的JoyEgoCam采集终端,便能轻松获取上肢轨迹、力度分布、人与家居环境的交互关系等关键参数。这些数据对于具身智能模型的理解和学习至关重要。

通过可穿戴设备,普通人也能在工厂、物流、零售、医疗以及家庭等多种环境中完成数据采集工作,从而大大降低了数据采集的门槛,拓展了采集场景的多样性。这也是当下行业内共同探索并采用的解决方案,旨在让数据采集更加普及和高效。

一位居家采集人员向《徽声在线》记者透露,数采机会配备内存卡,当内存卡储满数据时,意味着完成了6个小时的采集工作。她们每月的收入在3000元到3500元之间,多劳多得,既灵活又实惠。除了数采人员外,这一领域还衍生出了数据标注师、模型训练师等新兴职业,为更多人提供了就业机会。

采集回来的数据需要经过上传、清洗、质检、标注、训练、验证等一系列复杂流程,才能最终成为“数据燃料”,输入到具身智能模型中,为其提供源源不断的动力和支持。

《徽声在线》记者还注意到,除了社区外,京东具身智能数据采集中心内还设有零售商超、物流仓储等场景的数据采集区域。与居家等场景相比,产线上的数据采集工作对专业度要求更高,需要操作更复杂的设备,并更全面地记录视觉、触觉、空间轨迹等全维度数据,以确保数据的准确性和完整性。


图:京东机器人数据采集中心繁忙有序,来源:徽声在线记者 王郁彪 摄

京东具身智能数据采集负责人向《徽声在线》记者介绍,这些数据采集完成后,会经过完整的数据清洗流程,形成可用的数据集,用于模型预训练。相关模型借助这些数据完成学习后,将初步具备执行各类任务的泛化能力。最后,当模型被搭载到机器人本体上时,机器人便能依靠模型的推理能力去执行各类不同任务,实现智能化操作。

多场景数据采集,提升模型泛化能力是关键

除了社区居家场景外,《徽声在线》记者还实地探访了宿迁的康养中心、果园等地。在养老院,采集员们记录协助老人起身、喂药、康复训练等照护动作,为服务机器人提供人类照护行为样本,助力机器人更好地服务于老年人群体。

在果园内,采集内容则更加丰富多样,覆盖了果蔬采摘的手眼协调轨迹、农具握持与操作的力学数据、田间不规则地形下的行走与避障动作等。这些数据旨在适应农业作业的复杂环境等特征,为农业机器人的研发提供有力支持。

而在制衣厂,采集员们则在缝纫、裁剪、质检等工位作业,记录手部精细操作、多工位流转等数据。这些数据为工业柔性操作模型提供了小样本、高精度、可复用的训练素材,有助于提升工业机器人的操作灵活性和精准度。

那么,具身智能模型的训练究竟需要什么样的数据呢?这是行业内普遍关注的问题。

具身智能公司帕西尼数采负责人向《徽声在线》记者表示,数据收集需要多场景数据的支撑。多场景的数据收集、植入训练的是模型的泛化能力。就是当你告诉机器人去做任务A、B、C的时候,它通过对A、B、C数据的学习,哪怕它之前没有做过D任务,但是经过模拟训练之后,也能具备完成D任务的能力。

“我们之前拿到了京东的视觉EGO数据集(EGO数据集是指多个以‌第一人称视角‌为核心的视频数据集集合)之后,配合我们(机器人)触觉的数据收集,对人类的日常工作模块进行了全面补齐。”他进一步介绍道,这有助于提升机器人对人类行为的理解和模仿能力。

此外,对于具身智能数据采集,他认为最重要的有两点:一是需要覆盖到人类的感知层面,确保数据能够真实反映人类的感知体验;二是在数据收集时维持人类原本的意图,确保数据能够准确传达人类的行为目的和意图。“我们在收集的时候不以收集为目标,而是记录人类以当前意图去完成这个任务时,他做出的所有动作。虽然我们看到的数据是动作,但实际上更深层次,需要训练模型理解做这个任务时人类的行为和意图。”他强调道。

2年1000万小时数据目标,能否解具身智能“数据饥渴”?

觅蜂科技董事长兼CEO(首席执行官)、智元机器人合伙人姚卯青此前公开表示,训练类似ChatGPT-5级别的系统所需语料达百亿小时量级,而具身智能可用数据仅在50万小时量级,规模差距悬殊。此外,还存在标准缺失、质量不一、供需错配等问题,制约了具身智能的快速发展。


图:机器人训练场景紧张有序,来源:徽声在线记者 王郁彪 摄

与大语言模型相比,具身智能的数据积累无疑还处于早期阶段。《徽声在线》记者此前也从京东方面了解到,其认为具身智能要达到真正可用,至少需要1000万小时级别的真实场景交互数据。然而,当前行业数据规模仅约100万小时,数据缺口高达10倍之多,亟待填补。

融资规模不断被刷新,量产步伐全面提速,市场规模水涨船高……一年比一年热闹的具身智能赛道,却深陷“数据荒漠”困境。这背后必然有很多不可控因素,但如今,京东、智元等已经开始积极做具身智能数据的采集工作,为行业发展注入新的活力。那么,数据采集完成后,这些数据如何真正融入机器人的“大脑”呢?

京东具身智能相关负责人向《徽声在线》记者介绍,底层硬件设备完成物理世界真实数据采集后,需要被送至“工具层”。这个“工具层”可以理解为一个“工具箱”,里面包含了数据处理、模型训练以及仿真评测等一系列工具和功能,用于对采集到的数据进行深度加工和处理。

“再往上就是模型层,也就是所谓的‘大脑’。它包含了VLA模型(视觉—语言—动作模型)、VLN模型(视觉—语言导航)、世界模型等核心能力。这些模型是机器人的智慧源泉,决定了机器人的行为和能力。”该负责人透露道。最顶层就是应用层,即这些技术最终落地的场景,比如家政服务、物流配送、医疗辅助、零售服务、工业制造等,让机器人真正走进人们的生活和工作之中。

机器人如何在物流、家庭、工业等现实场景中真正“落地生根”并发挥作用?这仍是一个需要无数机器人整机企业、具身智能数据公司反复探索并倾注全部心血去解答的课题与过程。这场关于具身智能基础设施的竞赛没有终点,谁先打通道路、积累足够的数据“燃料”,谁就更有可能在机器人“大脑”时代的赛跑中抢占未来十年的主动权,引领行业发展潮流。

点击展开全文
你关注的
微信电脑端重大更新:可滚动截长图与支持发语音功能上线微信电脑端重大更新:可滚动截长图与支持发语音功能上线 上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动上海布局太空算力新赛道,全球首颗光计算卫星研制正式启动 全球最大比特币资管公司战略转向:或启动大规模抛售计划全球最大比特币资管公司战略转向:或启动大规模抛售计划
相关文章
探秘京东机器人数采中心:宝妈工人齐参与,数据助力AI闯入现实世界探秘京东机器人数采中心:宝妈工人齐参与,数据助力AI闯入现实世界 小米汽车再出招,YU7系列挑战特斯拉Model Y,价格与性能双优势小米汽车再出招,YU7系列挑战特斯拉Model Y,价格与性能双优势 成都金牛区发力西部量子科技产业高地 多项核心举措同步推进成都金牛区发力西部量子科技产业高地 多项核心举措同步推进 中国充电联盟:2026年1-4月充电设施新增186.3万台 快充占比超四成中国充电联盟:2026年1-4月充电设施新增186.3万台 快充占比超四成 比亚迪回应收购玛莎拉蒂传闻:纯属虚构比亚迪回应收购玛莎拉蒂传闻:纯属虚构 38.99万元起售!小米YU7 GT跑车级SUV震撼上市,雷军强调安全驾驶38.99万元起售!小米YU7 GT跑车级SUV震撼上市,雷军强调安全驾驶