⏶7
泼溅物理场景:利用不完美机器人数据实现端到端虚实迁移
发表
由
Mauro Comi 提交
作者: Ben Moran,
Mauro Comi, Steven Bohez, Tom Erez, Zhibin Li, Leonard Hasenclever
摘要
直接从真实世界机器人运动创建精确的物理模拟,对于安全、可扩展且经济的机器人学习具有巨大价值,但仍然极具挑战性。真实机器人数据存在遮挡、嘈杂的相机姿态和动态场景元素等问题,这些问题阻碍了对未知对象创建几何精确且逼真的数字孪生。我们引入了一种新颖的从现实到模拟(real-to-sim)框架,一次性解决了所有这些挑战。我们的关键洞察是一种混合场景表示,它将 3D 高斯泼溅(3D Gaussian Splatting)的逼真渲染与适用于物理模拟的显式物体网格融合到单一表示中。我们提出了一个端到端优化流程,该流程利用 MuJoCo 中的可微分渲染和可微分物理,直接从原始和不精确的机器人轨迹中共同优化所有场景组件——从物体几何形状和外观到机器人姿态和物理参数。这种统一优化使我们能够同时实现高保真度的物体网格重建、生成逼真的新视角,并执行无需标注的机器人姿态校准。我们既在仿真中又在使用 ALOHA 2 双臂机械手的具有挑战性的真实世界序列上展示了我们方法的有效性,从而实现了更实用和鲁棒的从现实到模拟的管道。
我们很高兴能分享我们在弥合机器人领域真实与模拟之间鸿沟的工作。从真实机器人数据创建准确、物理就绪的模拟非常具有挑战性,尤其是在使用低成本硬件时。像3D高斯泼溅(3D Gaussian Splatting, 3DGS)这样的方法在照片真实感方面表现出色,但它们的表示方式与物理引擎不直接兼容。在我们的论文中,我们介绍了SplatMesh,这是一种混合场景表示,它将3DGS与明确的、物理就绪的三角形网格相结合。我们将其嵌入到一个完全可微分的端到端框架中,该框架结合了可微分渲染和基于MuJoCo MJX的可微分物理。这使我们能够使用原始RGB图像同时优化一切:物体的几何形状和外观、机器人的姿态以及相机参数。我们还展示了我们的方法和表示是全面的,并且允许生成新的资产,包括高斯泼溅和网格。我们在真实的ALOHA 2机械手上演示了我们的方法,成功地从其不完美的轨迹数据中重建了高保真3D资产。我们希望这项工作能使高保真数字孪生的创建变得更加实用和健壮!