Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes

2024年07月16日
  • 简介
    在计算机视觉中,目标检测是一个重要的任务,可以应用于许多场景。然而,在拥挤的场景下获得广泛的标签可能会带来挑战。最近,提出了Segment Anything Model(SAM)作为一种强大的零样本分割器,为实例分割任务提供了一种新颖的方法。然而,SAM及其变体在处理拥挤和遮挡场景中的物体时,其准确性和效率经常会受到影响。在本文中,我们介绍了Crowd-SAM,这是一个基于SAM的框架,旨在通过少量可学习参数和最少的标记图像来提高SAM在拥挤和遮挡场景中的性能。我们引入了一种高效的提示采样器(EPS)和一个部分-整体判别网络(PWD-Net),增强了拥挤场景中的掩模选择和准确性。尽管其简单性,Crowd-SAM在几个基准测试中与最先进的全监督目标检测方法相媲美,包括CrowdHuman和CityPersons。我们的代码可在https://github.com/FelixCaae/CrowdSAM上找到。
  • 图表
  • 解决问题
    提高在拥挤场景下零样本分割的准确性和效率。
  • 关键思路
    提出了基于SAM的Crowd-SAM框架,其中包括高效的提示采样器(EPS)和部分-整体判别网络(PWD-Net),以提高在拥挤和遮挡场景中的实例分割准确性。
  • 其它亮点
    Crowd-SAM框架在CrowdHuman和CityPersons等基准测试中与最先进的全监督对象检测方法相媲美。代码已在GitHub上开源。
  • 相关研究
    最近的相关研究包括:Zero-shot instance segmentation (ZSIS)、Segment Anything: Towards Zero-shot Instance Segmentation with Instance-level Recognition and Semantic Segmentation、Fully Convolutional Instance-aware Semantic Segmentation等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论