戴盟与中国移动共建具身智能众包数据采集网络

具身智能面临高质量真机数据严重短缺,全球可用数据仅约50万小时,而单个技能点达交付级需2000至5000小时训练数据,缺口达千万至百亿小时量级。

6月10日,戴盟机器人与中国移动宣布合作,依托后者全国数十万家线下营业厅,构建“外发式”数据采集网络。首个试点基地已于湖南郴州落成,定位为全球首家“具身数据采集5S店”,计划7月15日进入常态化运营。

该5S店集展示、数据采集培训、设备供给、售前售后服务及数据-模型-场景协同于一体。普通市民经短期培训后,可佩戴二指夹爪、触觉手套与头戴相机,在家居、物流、制造等五大真实场景中参与数据采集。项目初期投放1000套设备,满产状态下年数据产出预计达100万小时。

京东亦同步推进同类众包项目。其于3月宣布建设全球规模最大、场景最全的具身智能数据采集中心,计划动员内部超10万名员工及外部50万名各行业人士参与,仅宿迁一地即覆盖超10万市民,涉及家庭、办公室、工厂、物流、商店、餐厅、医疗、环卫等超百个细分场景。

京东目标一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,并同步实现机器人本体数据采集100万小时。4月中旬,京东发布覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,推出自研可穿戴式超高清采集终端JoyEgoCam,并上线具身智能数据交易平台,首批定向开放2000小时高精标注数据集。

目前,京东宿迁数据采集中心可容纳近万人同步作业,形成“社区众包+工业定点”双轨采集模式。其4月数据显示,数采项目日处理数据量达数十万条,数据有效率95%,整体处理成本降低60%。

众包模式具备三方面价值:显著降低采集成本,遥操作数据每小时成本可达数百美元,而众包方式借助轻量化设备与真实场景大幅压缩开支;提升场景多样性,一万采集员对应一万种房间布局、光照条件与操作习惯,增强模型泛化能力;构建多方共赢闭环,采集员获报酬、企业获数据与流量、行业获稀缺资源。

但众包并非万能方案。数据质量参差不齐,缺乏统一格式与质量标准;人体生理局限导致微颤、疲劳、反应延迟等影响精细动作采集精度;人力规模存在上限,难以支撑百亿小时级需求。

行业共识正转向构建“数据金字塔”架构:底层为互联网视频与仿真合成数据,规模大但物理接触信息缺失,适用于预训练;中层为以人为中心的实景采集数据,含众包模式,提供真实世界操作序列,兼具规模性与真实性,但质量控制成本高;顶层为真机遥操作采集数据,精度最高、最贴近机器人实际运行状态,但效率低、成本高,适用于核心任务攻坚。

上述路径非替代关系,而是分工协同:仿真数据提供规模基础,众包数据注入真实场景,遥操作数据保障关键精度,共同推动模型从“能看会认”迈向“能做会干”。戴盟与中国移动的合作,标志着具身智能数据基建由封闭实验室走向全民参与的新阶段。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号