论文标题:Instance-level Image Retrieval using Reranking Transformers 论文链接:https://arxiv.org/abs/2103.12236 作者单位:弗吉尼亚大学 & eBay

本文提出用于实例级图像检索的Reranking Transformers (RRTs),表现SOTA!性能优于GV、DELG等网络。

实例级图像检索是在大型数据库中搜索与查询图像中的对象匹配的图像的任务。为了解决此任务,系统通常依赖于使用全局图像描述符的检索步骤,以及随后的步骤,该步骤通过利用诸如基于局部特征的几何验证之类的操作来执行特定于域的细化或重新排序。在这项工作中,我们提出使用Reranking Transformers(RRT)作为通用模型,结合局部和全局特征,以监督的方式对匹配图像进行重排,从而取代相对昂贵的几何验证过程。 RRT重量轻且易于并行化,因此可以在单个前向通过中对一组顶级匹配结果进行重新排名。我们在Revisited Oxford和Paris数据集以及Google Landmark v2数据集上进行了广泛的实验,结果表明RRT在使用更少的本地描述符的情况下优于以前的重排序方法。此外,我们证明,与现有方法不同,RRT可以与特征提取器一起进行优化,这可以导致针对下游任务量身定制的特征表示形式以及进一步的准确性改进。训练代码和预先训练的模型将公开。

内容中包含的图片若涉及版权问题,请及时与我们联系删除