- 简介确定地球上任何图像的位置是一个复杂的视觉任务,这使得评估计算机视觉算法特别相关。然而,缺乏标准的、大规模的、可靠的可定位图像的开放数据集限制了其潜力。为了解决这个问题,我们介绍了OpenStreetView-5M,这是一个大规模的、开放的数据集,包括超过510万个地理参考的街景图像,涵盖了225个国家和地区。与现有的基准数据集不同,我们强制执行严格的训练/测试分离,使我们能够评估学习到的地理特征的相关性,而不仅仅是记忆。为了展示我们数据集的实用性,我们进行了各种最先进的图像编码器、空间表示和训练策略的广泛基准测试。所有相关的代码和模型都可以在https://github.com/gastruc/osv5m找到。
- 图表
- 解决问题OpenStreetView-5M这篇论文试图解决什么问题?
- 关键思路OpenStreetView-5M这篇论文的关键思路是什么?
- 其它亮点论文使用了一个新的大规模、开放式的数据集,进行了各种图像编码器、空间表示和训练策略的广泛基准测试,并提供了所有相关代码和模型。
- 这篇论文是最近关于计算机视觉领域的大规模、开放式数据集的研究之一,与现有的基准数据集有所不同。
沙发等你来抢
去评论
评论
沙发等你来抢