Unleashing Unlabeled Data: A Paradigm for Cross-View Geo-Localization

简介

本文研究了在大范围跨视图地理定位（CVGL）中有效利用未标记数据的方法，包括无监督和半监督设置。通常的CVGL方法依赖于地面-卫星图像对，并采用基于标签的监督训练。然而，收集精确的跨视图图像对的成本阻碍了CVGL在实际场景中的部署。没有这些图像对，CVGL将更难处理地面和卫星图像之间的显著成像和空间差距。为此，我们提出了一个无监督框架，包括跨视图投影来指导模型检索初始伪标签，以及快速重新排序机制来通过利用“完全匹配的地面-卫星图像位于唯一且相同的场景”这一事实来优化伪标签。该框架在三个开源基准测试中表现出与监督方法相当的性能。我们的代码和模型将在https://github.com/liguopeng0923/UCVGL上发布。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文研究如何有效利用未标记数据进行大范围交叉视角地理定位（CVGL），包括无监督和半监督设置。
关键思路

本文提出了一个无监督框架，包括交叉视图投影来指导模型检索初始伪标签，以及快速重新排序机制来通过利用“完美匹配的地面-卫星图像位于唯一和相同的场景”来优化伪标签。
其它亮点

实验结果表明，本文提出的无监督框架在三个开源基准测试中表现出与监督方法相当的性能，并且作者已经在github上发布了代码和模型。
相关研究

近期在这个领域中，还有一些相关的研究，如“Cross-view image geolocalization with visual attention mechanism”和“Large-scale image retrieval with attentive deep local features”等。

Unleashing Unlabeled Data: A Paradigm for Cross-View Geo-Localization

提问交流

提问交流