论文标题:V2F-Net: Explicit Decomposition of Occluded Pedestrian Detection 论文链接:https://arxiv.org/abs/2104.03106 作者单位:旷视科技 & 德克萨斯A&M大学

表现SOTA!性能优于CrowdDet、NOH-NMS等网络。

在行人检测中,遮挡非常具有挑战性。在本文中,我们提出了一种简单而有效的方法,称为V2F-Net,该方法将遮挡的行人检测显式分解为可见区域检测和全身估计。 V2F网络由两个子网组成:可见区域检测网络(VDN)和全身估计网络(FEN)。 VDN尝试对可见区域进行本地化,FEN会根据可见框来估计全身框。此外,为了进一步提高对人体的估计,我们提出了一种新颖的基于嵌入的part感知模块(EPM)。通过监督每个part的可见性,鼓励网络提取包含必要零件信息的特征。通过在两个具有挑战性的数据集上进行几次实验,我们通过实验证明了V2F-Net的有效性。与FPN基准相比,V2F-Net在CrowdHuman上实现了5.85%的AP增长,在CityPersons上实现了2.24%的MR-2改善。此外,在一阶段和两阶段检测器上的一致增益验证了我们方法的泛化性。

内容中包含的图片若涉及版权问题,请及时与我们联系删除