论文标题:Learning To Count Everything

论文链接:https://arxiv.org/abs/2104.08391

作者单位:纽约州立大学石溪分校 & VinAI研究院

本文将计数视为few-shot回归任务,其次提出了FamNet,专用于few-shot计数任务;还提出了一个few-shot计数数据集:FSC-147,包含超过6,000个图像和147个视觉类别,代码和数据集即将开源!

现有的视觉计数工作主要一次集中在一个特定的类别上,例如人,动物和细胞。在本文中,我们感兴趣的是对所有事物进行计数,也就是说,仅考虑来自该类别的几个带注释的实例,就可以对该类别中的对象进行计数。为此,我们将计数视为几步回归任务。为解决此任务,我们提出了一种新颖的方法,该方法将查询图像与来自查询图像的几个示例对象一起,并为查询图像中所有感兴趣对象的存在预测密度图。我们还提出了一种新颖的适应策略,可以在测试时仅使用来自新颖类别的几个示例对象,使我们的网络适应任何新颖的视觉类别。我们还引入了147个对象类别的数据集,其中包含6000多个图像,适用于 few-shot计数任务。图像使用两种类型的注释(点和边界框)进行注释,它们可用于开发few-shot计数模型。在此数据集上进行的实验表明,我们的方法优于几种最先进的目标检测器和few-shot计数方法。

 

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除