旷视科技 | V2F-Net：遮挡行人检测的显式分解

论文标题：V2F-Net: Explicit Decomposition of Occluded Pedestrian Detection 论文链接：https://arxiv.org/abs/2104.03106 作者单位：旷视科技 & 德克萨斯A&M大学

表现SOTA！性能优于CrowdDet、NOH-NMS等网络。

在行人检测中，遮挡非常具有挑战性。在本文中，我们提出了一种简单而有效的方法，称为V2F-Net，该方法将遮挡的行人检测显式分解为可见区域检测和全身估计。 V2F网络由两个子网组成：可见区域检测网络（VDN）和全身估计网络（FEN）。 VDN尝试对可见区域进行本地化，FEN会根据可见框来估计全身框。此外，为了进一步提高对人体的估计，我们提出了一种新颖的基于嵌入的part感知模块（EPM）。通过监督每个part的可见性，鼓励网络提取包含必要零件信息的特征。通过在两个具有挑战性的数据集上进行几次实验，我们通过实验证明了V2F-Net的有效性。与FPN基准相比，V2F-Net在CrowdHuman上实现了5.85％的AP增长，在CityPersons上实现了2.24％的MR-2改善。此外，在一阶段和两阶段检测器上的一致增益验证了我们方法的泛化性。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

旷视科技 | V2F-Net：遮挡行人检测的显式分解

评论列表

评论