300万条数据哪里来?揭秘人形机器人“数据特训”-华龙网

300万条数据哪里来?揭秘人形机器人“数据特训”

2026-03-24 07:04:39 来源: 央视新闻客户端

image

记者日前从北京市经济和信息化局了解到,北京人形机器人创新中心数据采集与训练基地投用4个月以来,内部研发数据采集量已经超过300万条,开源数据超30万条,已为多家头部企业及科研机构交付超数万小时高质量数据。这些数据究竟有什么用途?

作为全国最齐全场景覆盖的机器人数据训练基地之一,北京人形机器人创新中心数据基地一期建筑面积近5000平方米,包括约200平方米的专业光学动作捕捉场地。记者在现场看到,120多台机器人分别在家居、商超、办公、工业、医药、康养等领域30余个典型场景中,进行现场的数据采集与训练。这些场景并非静态的“样板间”,其光照条件、物体摆放、人员动线均可按需调整,确保采集数据具备充分的泛化能力。

总台记者 马欣欣:在搭建的是“儿童房”的场景中,模型训练师正在操控机器人去把这个反了的袜子给翻过来。完成这些动作的同时,也会实时采集这些机器人关节角度值、运行轨迹等多个数据,一共300到1000次才能完成一个动作的数据采集。

针对初期机器人数据采集存在的场景碎片化、不同构型机器人适配难、数据质量参差不齐等瓶颈问题,基地也通过制定标准化的采集流程规范,确保整体数据合格率稳定在95%以上。截至目前,内部研发数据采集量已超300万条,开源数据超30万条。

北京人形机器人创新中心具身天工事业部负责人 蒋未来:可以为中小型机器人用户至少节省50%以上的数据采集成本。

责任编辑:陈丹丹