DETR for Pedestrian Detection 论文链接:https://arxiv.org/abs/2012.06785 作者单位:清华大学(邓志东团队), 商汤科技, 牛津大学, 悉尼大学 表现SOTA!性能优于Deformable DETR、AdaptiveNMS和CSP等网络,代码即将开源!

由于启发式定义的从anchor到行人的映射以及NMS与高度重叠的行人之间的冲突,在人群场景中的行人检测提出了一个具有挑战性的问题。最近提出的端到端检测器(ED),DETR和可变形DETR,使用Transformer体系结构替代了手工设计的组件(如NMS和anchor),该体系结构通过计算查询之间的所有成对交互关系而消除了重复的预测。受这些作品的启发,我们探索了它们在行人检测中的表现。令人惊讶的是,与带有FPN的Faster-RCNN相比,结果与在COCO上获得的结果相反。此外,由于人群场景中的ground truth数字大,ED的 bipartite match会损害训练效率。在这项工作中,我们确定了导致ED性能不佳的根本原因,并提出了一种新的解码器来解决这些问题。此外,我们设计了一种机制来利用行人较少被遮挡的可见部分,专门用于ED,并实现进一步的改进。还引入了一种更快的二分匹配算法,以使针对人群数据集的ED训练更加实用。提出的检测器PED(行人端到端检测器)在CityPersons和CrowdHuman上均优于以前的ED和基线Faster-RCNN。它也可以通过最先进的行人检测方法获得可比的性能。代码即将发布。

内容中包含的图片若涉及版权问题,请及时与我们联系删除