中国X Square Robot开源无机器人数据收集框架
2026-06-12 15:47
收藏

维度网讯,深圳机器人公司X Square Robot发布了XRZero-G0,这是一套开源硬件和软件框架,用于从人类操作员收集机器人训练数据、生成策略并在实体机器人上进行测试。该代码采用MIT许可证,并与G0-Dataset数据集一同托管于GitHub平台。

无机器人数据收集

传统方式依赖实体机器人来收集训练样本,每次操作会话产生的演示数据极为有限,这直接制约了训练具身AI所需数据集的规模。人类演示者提供了一种更低成本的数据来源,X Square Robot将这一方法集成为可公开获得的系统。该公司为体力劳动场景开发机器人,过去这类公司需投入大量时间与资金手动操作机器以采集训练样本。

实体机器人通过多个摄像头感知周围环境。头戴式摄像头负责捕捉大范围场景,腕戴式摄像头则精细记录手部与物体的交互细节。许多人工操作收集装置仅依赖腕部视图,这导致训练数据与机器人实际部署时的感知方式存在偏差。XRZero-G0利用头戴式摄像头与两个腕部摄像头,同步记录广泛的场景上下文与近距离的精细操作,并将这些视角映射到与机器人感知匹配的共享表示中。搭配可穿戴VR界面与可互换夹爪,单个操作员可以产生适用于不同机器人本体的演示数据。

来自人类演示者的数据存在质量问题,可能影响其训练价值。XRZero-G0构建了一个包含收集、检查、训练与评估的闭环流程,用以筛选进入训练环节的样本。在观测层面,多视图几何一致性约束减少了图像与运动之间的错位;在运动学层面,带有碰撞与关节限制约束的全身逆运动学算法剔除了无效轨迹;在策略层面,在实体机器人上回放执行则作为最终验证。据X Square Robot报告,在受控设置下,该系统的有效数据产量接近85%。

该公司指出,无机器人和真实机器人数据可以协同工作。将大约10个人类收集的演示片段与1个真实机器人记录片段相结合,在测试任务中达到了与完全由真实机器人数据构成的训练集相当的性能。人类收集的数据提供了广泛的行为覆盖,而少量真实机器人数据则用于锚定电机延迟、摩擦等物理参数。在测试条件下,这一比例将真实机器人数据需求量降低多达20倍。

G0-Dataset数据集包含超过2000小时经过验证的演示,覆盖视觉、触觉与听觉模态,涵盖3000个不同的操作任务,分布遵循长尾特征。操作员峰值数据收集速度达到每小时93.2个片段。该数据集支持大规模预训练与跨机器人本体的迁移研究。X Square Robot表示,基于该框架训练的策略能够泛化到具有不同机器人姿态、桌面高度与视角的收集环境,并展现出对训练集之外机器人平台的零样本迁移能力,无需针对新平台进行微调即可执行任务。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com