DVF: Advancing Robust and Accurate Fine-Grained Image Retrieval with Retrieval Guidelines

向作者提问

NEW

简介

本文介绍了细粒度图像检索（FGIR）的概念，即学习区分外观相似对象的视觉表征，同时保持泛化性。现有方法提出了生成具有区分性的特征，但很少考虑FGIR任务本身的特殊性。本文通过细致的分析，提出了实用的指导方针，以识别子类别特定差异并生成具有区分性的特征，从而设计有效的FGIR模型。这些指导方针包括强调对象（G1）、突出子类别特定差异（G2）和采用有效的训练策略（G3）。在遵循G1和G2的基础上，我们设计了一种新颖的双重视觉过滤机制，称为DVF，用于捕捉子类别特定差异。具体而言，双重视觉过滤机制包括面向对象的模块和面向语义的模块。这些组件分别用于放大对象和识别具有区分性的区域。在遵循G3的基础上，我们实现了一种具有区分性的模型训练策略，以提高DVF的区分能力和泛化能力。广泛的分析和消融研究证实了我们提出的指导方针的有效性。在没有花哨的情况下，所提出的DVF在三个广泛使用的细粒度数据集上实现了最先进的性能，在封闭集和开放集设置中表现出色。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在解决细粒度图像检索（FGIR）任务中，如何学习区分相似物体的视觉表示，同时保持泛化能力的问题。
关键思路

本文提出了三个实用的指南，包括强调对象、突出子类别特异性差异和采用有效的训练策略，以生成具有区分度的特征，设计有效的FGIR模型。同时，本文还提出了一种新的双重视觉滤波机制DVF，用于捕捉子类别特异性差异。
其它亮点

本文的亮点包括提出了三个实用的指南，设计了新的双重视觉滤波机制DVF，并通过实验验证了其有效性。实验使用了三个广泛使用的细粒度数据集，并在封闭集和开放集设置下均取得了最先进的性能。同时，该论文提供了开源代码。
相关研究

最近在这个领域中，还有一些相关研究，如：Learning Discriminative Features for Fine-Grained Image Retrieval，Fine-grained Visual Categorization，Fine-grained Recognition Benchmark等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问