
论文标题: OW-DETR: Open-world Detection Transformer
论文链接:https://arxiv.org/abs/2112.01513
开放世界目标检测(OWOD,Open-world object detection) 是一个极具挑战性的计算机视觉话题,其任务是训练一个目标检测器,同时检测图片中已知类别和未知类别的目标。此外,还需要赋予检测器增量学习的能力,随着训练代数的深入,模型可识别的目标类别也在增加,这就要求检测器能够将未知目标与背景分离,同时生成高质量的候选框(candidate proposals)。与标准目标检测的任务设置相比,OWOD的任务设置难度较大,为此,Inception-AI、谷歌等单位提出了一种基于端到端Transformer开放世界对象检测框架OW-DETR。本文提出的OW-DETR主要由三个模块构成,包括注意力驱动的伪标签生成(attention-driven pseudo-labeling)、新颖性分类(novelty classification)和客观性评分(objectness scoring)。本文的实验在MS-COCO和PASCAL VOC两个数据集上进行,在增量目标检测的设置下,达到了SOTA性能。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢