OpenStreetView-5M: The Many Roads to Global Visual Geolocation

Guillaume Astruc,
Nicolas Dufour,
Ioannis Siglidis,
Constantin Aronssohn,
Nacim Bouia,
Stephanie Fu,
Romain Loiseau,
Van Nguyen Nguyen,
Charles Raude,
Elliot Vincent,
Lintao XU,
Hongyu Zhou,
Loic Landrieu
94
热度
CV
AI
2024年04月29日
  • 简介
    确定地球上任何图像的位置是一个复杂的视觉任务,这使得评估计算机视觉算法特别相关。然而,缺乏标准的、大规模的、可靠的可定位图像的开放数据集限制了其潜力。为了解决这个问题,我们介绍了OpenStreetView-5M,这是一个大规模的、开放的数据集,包括超过510万个地理参考的街景图像,涵盖了225个国家和地区。与现有的基准数据集不同,我们强制执行严格的训练/测试分离,使我们能够评估学习到的地理特征的相关性,而不仅仅是记忆。为了展示我们数据集的实用性,我们进行了各种最先进的图像编码器、空间表示和训练策略的广泛基准测试。所有相关的代码和模型都可以在https://github.com/gastruc/osv5m找到。
  • 图表
  • 解决问题
    OpenStreetView-5M这篇论文试图解决什么问题?
  • 关键思路
    OpenStreetView-5M这篇论文的关键思路是什么?
  • 其它亮点
    论文使用了一个新的大规模、开放式的数据集,进行了各种图像编码器、空间表示和训练策略的广泛基准测试,并提供了所有相关代码和模型。
  • 相关研究
    这篇论文是最近关于计算机视觉领域的大规模、开放式数据集的研究之一,与现有的基准数据集有所不同。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论