On the Estimation of Image-matching Uncertainty in Visual Place Recognition

2024年03月31日
  • 简介
    在视觉地点识别(VPR)中,通过将查询图像与具有已知位置的参考图像地图进行比较,估计查询图像的位置。与图像检索问题一样,特征提取器将查询和参考图像映射到特征空间,然后进行最近邻搜索。然而,直到最近,很少关注量化检索到的参考图像是正确匹配的置信度。高度确定但不正确的检索可能导致基于VPR的定位管道的灾难性失败。本文首次比较了估计图像匹配不确定性的主要方法,包括传统的基于检索的不确定性估计、更近期的数据驱动的aleatoric不确定性估计以及计算密集的几何验证。我们进一步制定了一个简单的基线方法“SUE”,与其他方法不同的是,它考虑了地图中参考图像的免费姿势。我们的实验表明,查询和参考描述符之间的简单L2距离已经比当前的数据驱动方法更好地估计了图像匹配的不确定性。SUE优于其他有效的不确定性估计方法,并且其不确定性估计补充了计算密集的几何验证方法。未来在VPR中进行不确定性估计的工作应考虑本文中讨论的基线。
  • 图表
  • 解决问题
    本论文旨在解决视觉位置识别(VPR)中图像匹配不确定性的问题,以避免高度确定但错误的匹配导致VPR定位失败的情况。
  • 关键思路
    论文比较了传统的基于检索的不确定性估计方法、最近的数据驱动的aleatoric不确定性估计方法和计算密集的几何验证方法,并提出了一种简单的基线方法SUE,该方法考虑了参考图像的位置信息。实验结果表明,与当前数据驱动方法相比,简单的L2距离已经是更好的图像匹配不确定性估计方法。SUE方法优于其他高效的不确定性估计方法,并且其不确定性估计结果可以与计算密集的几何验证方法相互补充。
  • 其它亮点
    论文设计了实验来比较不同的图像匹配不确定性估计方法,并提出了一种新的基线方法。实验结果表明,简单的L2距离已经是更好的图像匹配不确定性估计方法。SUE方法优于其他高效的不确定性估计方法,并且其不确定性估计结果可以与计算密集的几何验证方法相互补充。论文还提供了数据集和开源代码。
  • 相关研究
    在最近的研究中,也有一些相关的工作。例如,"NetVLAD: CNN architecture for weakly supervised place recognition"和"Bayesian uncertainty estimation for batch normalized deep networks"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论