AimBot:一个简单的辅助视觉线索,用于增强视觉运动策略的空间感知

发表
DaiDai 提交
作者: DaiYinpei Dai, Jayjun Lee, Yichi Zhang, Ziqiao Ma, Jed Yang, Amir Zadeh, Chuan Li, Nima Fazeli, Joyce Chai

摘要

在本文中,我们提出了 AimBot,一种轻量级的视觉增强技术,通过提供明确的空间线索来改进机器人操作中的视觉运动策略学习。AimBot 将射击线和瞄准十字线叠加到多视图 RGB 图像上,提供辅助视觉指导,编码末端执行器的状态。这些叠加图由深度图像、相机外参和当前末端执行器姿态计算得出,明确传达了夹持器和场景中物体之间的空间关系。AimBot 产生的计算开销极小(小于 1 毫秒),并且不需要更改模型架构,因为它只是用增强的图像替换原始 RGB 图像。尽管其简单,我们的结果表明 AimBot 在模拟和现实世界环境中持续改进了各种视觉运动策略的性能,突出了空间定位视觉反馈的优势。
查看 arXiv 页面查看 PDF

评论

DaiDai
论文作者
论文提交者

TL;DR: AimBot 是一种轻量级视觉增强技术,提供明确的空间线索以改进 VLA 模型。

网站:https://aimbot-reticle.github.io/