Domain adaptive pose estimation via multi-level alignment

简介

域自适应姿态估计旨在使在源域（合成）数据集上训练的深度模型在目标域（真实世界）数据集上产生类似的结果。现有方法通过进行图像级或特征级对齐取得了显著进展。然而，仅在单个级别上进行对齐是不足以完全弥合域差距并实现出色的域自适应结果的。本文提出了一种多级域自适应方法，它在图像、特征和姿态级别上对不同域进行对齐。具体而言，我们首先利用图像风格转移确保源域和目标域的图像具有类似的分布。随后，在特征级别上，我们采用对抗训练尽可能使源域和目标域的特征保持域不变的特性。最后，在姿态级别上，我们使用自监督方法使模型学习多样的知识，隐性地解决了域差距。实验结果表明，所提出的多级对齐方法在姿态估计中可以取得显著的改进，对于人体姿态估计，其优于先前的最新技术水平高达2.4％，对于狗的动物姿态估计高达3.1％，对于羊的动物姿态估计高达1.4％。
解决问题

本文旨在解决深度模型在源域（合成）数据集上训练后，在目标域（真实世界）数据集上产生类似结果的问题。具体而言，作者提出了一种多层次领域自适应方法，以图像、特征和姿势层次对不同域进行对齐。
关键思路

本文的关键思路是多层次领域自适应方法，包括图像风格迁移、对抗训练和自监督学习，以解决单一层次对齐不足以完全弥合域差距的问题。
其它亮点

本文实验结果表明，多层次对齐方法在姿势估计中取得了显著的改进，对人体姿势估计的表现优于之前的最先进方法高达2.4％，对狗的姿势估计提高了3.1％，对羊的姿势估计提高了1.4％。本文使用了公开数据集，且开源了代码，对领域自适应和姿势估计具有重要的参考价值。
相关研究

最近在领域自适应和姿势估计方面还有很多相关研究，如《Unsupervised Domain Adaptation for 3D Keypoint Estimation via View Consistency》和《Unsupervised Domain Adaptation for Human Pose Estimation via Randomized Smoothing》等。

Domain adaptive pose estimation via multi-level alignment

评论