Self-Supervised Geometry-Guided Initialization for Robust Monocular Visual Odometry

2024年06月03日
  • 简介
    单目视觉里程计是各种自主系统中的关键技术。与传统的基于特征的方法相比,由于光照不足、纹理不足、大幅度运动等原因,传统方法容易出现故障,而最近的基于学习的 SLAM 方法利用迭代稠密束调整来解决这些故障情况,并在各种真实环境中实现了强大准确的定位,而不依赖于特定领域的训练数据。然而,尽管具有潜力,基于学习的 SLAM 仍然难以处理涉及大运动和物体动态的情况。在本文中,我们通过分析户外基准测试中的主要故障案例和暴露其优化过程的各种缺陷,诊断了流行的基于学习的 SLAM 模型(DROID-SLAM)的关键弱点。然后,我们提出使用自监督先验,利用冻结的大规模预训练单目深度估计来初始化稠密束调整过程,从而实现稳健的视觉里程计,而无需微调 SLAM 骨干。尽管方法简单,但我们提出的方法在 KITTI 里程计以及具有挑战性的 DDAD 基准测试中都取得了显着的改进。代码和预训练模型将在发表时发布。
  • 图表
  • 解决问题
    本文试图解决学习型SLAM模型(DROID-SLAM)在大运动和物体动态场景下的定位问题。
  • 关键思路
    本文提出使用基于自监督先验的方法,利用已经训练好的大规模单目深度估计模型初始化密集束调整过程,从而实现稳健的视觉里程计。
  • 其它亮点
    本文通过分析DROID-SLAM在户外基准测试中的主要失败案例,揭示了其优化过程的各种缺陷,并提出了一种简单的解决方案。实验结果表明,所提出的方法在KITTI odometry和DDAD基准测试中都取得了显著的改进。作者将代码和预训练模型在发布时开源。
  • 相关研究
    最近的相关研究包括《Unsupervised Learning of Depth and Ego-Motion from Video》和《Visual Odometry Revisited: What Should Be Learnt?》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论