论文标题:Learning Heatmap-Style Jigsaw Puzzles Provides Good Pretraining for 2D Human Pose Estimation 论文链接:https://arxiv.org/abs/2012.07101 作者单位:中科院, 国科大, 地平线, 哈工大 本文提出一种自监督热图风格拼图的预训练方法,其优于在ImageNet上预训练和从头训练的方法,可提高HRNet、SimpleBaseline等网络性能。

2D人体姿态估计的目标是从输入2D图像中定位身体部位的关键点。最新的姿态估计方法通常从关键点构建像素级热图,作为学习卷积神经网络的标签,通常是随机初始化或使用ImageNet上的分类模型作为其骨干。我们注意到2D姿态估计任务高度依赖于图像patches之间的上下文关系,因此我们引入了一种自监督方法来对2D姿势估计网络进行预训练。具体而言,我们提出了热图样式拼图(HSJP)问题作为我们的任务,其目的是从混洗的patches组成的图像中了解每个patch的位置。在我们的预训练过程中,我们仅使用MS-COCO中的人物实例图像,而不引入额外的,更大的ImageNet数据集。设计了用于patch location的热图样式标签,并且我们的学习过程是非对比的。 HSJP pretext任务学习的权重被用作2D人体姿态估计器的主干,然后在MS-COCO人体关键点数据集上进行微调。利用HRNet和SimpleBaseline这两种流行且功能强大的2D人体姿势估计器,我们可以在MS-COCO验证和测试开发数据集上评估mAP得分。我们的实验表明,采用我们自监督的预训练的下游姿态估计器的性能要比从头开始训练的那些更好,并且可以与使用ImageNet分类模型作为其初始主干的方法进行比较。

内容中包含的图片若涉及版权问题,请及时与我们联系删除