Zero-shot Object Counting with Good Exemplars

2024年07月06日
  • 简介
    零样本物体计数(ZOC)旨在仅在测试期间使用对象类别名称而无需手动注释即可枚举图像中的对象。然而,当前ZOC方法面临的一个关键挑战在于无法有效地识别高质量的范例。这种缺陷阻碍了跨多种类的可扩展性,并破坏了已识别类别与图像内容之间的强视觉关联的发展。为此,我们提出了基于视觉关联的零样本物体计数(VA-Count)框架。VA-Count由范例增强模块(EEM)和噪声抑制模块(NSM)组成,这两个模块协同精细化处理类别范例识别的过程,同时最小化错误对象识别的后果。EEM利用先进的视觉语言预训练模型发现潜在的范例,确保框架适应各种类别。同时,NSM采用对比学习来区分最佳和次优范例对,减少错误范例的负面影响。VA-Count在零样本情境下展示了其有效性和可扩展性,在两个物体计数数据集上表现出优异的性能。
  • 图表
  • 解决问题
    本论文旨在解决零样本物体计数(ZOC)中的高质量样本识别问题,提高框架的适应性和可扩展性。
  • 关键思路
    本文提出了基于视觉关联的零样本物体计数(VA-Count)框架,包括样本增强模块(EEM)和噪声抑制模块(NSM),两者协同作用以提高类别样本的识别和减少错误样本的影响。
  • 其它亮点
    VA-Count框架采用先进的视觉-语言预训练模型来发现潜在的样本,同时采用对比学习来区分优化和次优化样本对,从而提高了框架的性能和可扩展性。论文在两个物体计数数据集上展示了VA-Count的有效性和可扩展性。
  • 相关研究
    最近的相关研究包括:1)使用生成对抗网络(GAN)进行ZOC;2)使用多模态特征和注意力机制来改进ZOC;3)使用多任务学习来提高ZOC的性能。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论