⏶9

AimBot：一个简单的辅助视觉线索，用于增强视觉运动策略的空间感知

08月11日发表

08月13日由 Dai 提交

作者: Yinpei Dai, Jayjun Lee, Yichi Zhang, Ziqiao Ma, Jed Yang, Amir Zadeh, Chuan Li, Nima Fazeli, Joyce Chai

摘要

在本文中，我们提出了 AimBot，一种轻量级的视觉增强技术，通过提供明确的空间线索来改进机器人操作中的视觉运动策略学习。AimBot 将射击线和瞄准十字线叠加到多视图 RGB 图像上，提供辅助视觉指导，编码末端执行器的状态。这些叠加图由深度图像、相机外参和当前末端执行器姿态计算得出，明确传达了夹持器和场景中物体之间的空间关系。AimBot 产生的计算开销极小（小于 1 毫秒），并且不需要更改模型架构，因为它只是用增强的图像替换原始 RGB 图像。尽管其简单，我们的结果表明 AimBot 在模拟和现实世界环境中持续改进了各种视觉运动策略的性能，突出了空间定位视觉反馈的优势。

查看 arXiv 页面查看 PDF

Dai

论文作者

论文提交者

TL;DR: AimBot 是一种轻量级视觉增强技术，提供明确的空间线索以改进 VLA 模型。

网站：https://aimbot-reticle.github.io/

AimBot：一个简单的辅助视觉线索，用于增强视觉运动策略的空间感知

摘要

评论