BEVCALIB:通过几何引导的鸟瞰图表示进行激光雷达-相机校准

发表
Weiduo YuanWeiduo Yuan 提交
作者: Weiduo YuanWeiduo Yuan, Jerry Li, Justin Yue, Divyank Shah, Konstantinos Karydis, Hang Qiu

摘要

精确的激光雷达-相机标定是实现自动驾驶和机器人系统中多模态感知融合的基础。传统的标定方法需要在受控环境中进行大量数据采集,并且无法补偿车辆/机器人移动期间的变换变化。在本文中,我们提出了第一个利用鸟瞰图(BEV)特征从原始数据执行激光雷达相机标定的模型,称为 BEVCALIB。为此,我们分别提取相机 BEV 特征和激光雷达 BEV 特征,并将它们融合到共享的 BEV 特征空间中。为了充分利用 BEV 特征的几何信息,我们引入了一种新颖的特征选择器,用于过滤转换解码器中最重要的特征,这减少了内存消耗并实现了高效训练。在 KITTI、NuScenes 和我们自己的数据集上进行的广泛评估表明,BEVCALIB 达到了新的最先进水平。在各种噪声条件下,BEVCALIB 在 KITTI 数据集上平均分别以 (47.08%, 82.32%) 的平移和旋转,在 NuScenes 数据集上平均分别以 (78.17%, 68.29%) 的平移和旋转,超越了文献中最佳基线。在开源领域,它将最佳可复现基线提高了一个数量级。我们的代码和演示结果可在 https://cisl.ucr.edu/BEVCalib 获取。
查看 arXiv 页面查看 PDF

评论

Weiduo YuanWeiduo Yuan
论文作者
论文提交者

📽️ 项目页面:cisl.ucr.edu/BEVCalib

📄 论文:arxiv.org/abs/2506.02587

💻 代码:github.com/UCR-CISL/BEVCalib