通用机器人策略中的捷径学习:数据集多样性和碎片化的作用

发表
Xu LuoXu Luo 提交
作者: Youguang Xing, Xu LuoXu Luo, Junlin Xie, Lianli Gao, Hengtao Shen, Jingkuan Song

摘要

在Open X-Embodiment (OXE) 等大规模数据集上训练的通用机器人策略在各种任务中表现出强大的性能。然而,它们往往难以泛化到训练数据分布之外。在本文中,我们研究了这种有限泛化能力的根本原因。我们确定捷径学习——对与任务无关的特征的依赖——是泛化的关键障碍。通过全面的理论和实证分析,我们发现了导致捷径学习的两个主要原因:(1)单个子数据集内的多样性有限,以及(2)子数据集之间显著的分布差异,导致数据集碎片化。这些问题源于OXE等大型数据集的固有结构,它们通常由在不同环境和具身中独立收集的多个子数据集组成。我们的发现为可以减少捷径学习并增强通用机器人策略泛化能力的数据集收集策略提供了重要见解。此外,在获取新的大规模数据不切实际的情况下,我们证明精心选择的机器人数据增强策略可以有效减少现有离线数据集中的捷径学习,从而提高通用机器人策略(例如 pi_0)在模拟和真实世界环境中的泛化能力。更多信息请访问 https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/
查看 arXiv 页面查看 PDF

评论

Xu LuoXu Luo
论文作者
论文提交者

[CoRL 2025] 为什么通用机器人策略往往难以泛化到其训练数据之外?以及这一洞察如何指导我们收集机器人数据集?我们在最新的工作中深入探讨了这些问题!

项目页面:https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/