今天给大家分享一篇瑞士苏黎世联邦理工学院Konrad Schindler老师和德国马克斯普朗克智能系统研究所Michael J. Black老师课题组联合发表在CVPR 2022上的一篇文章“BARC: Learning to Regress 3D Dog Shape from Images by Exploiting Breed Information”。为了解决从单一图像恢复狗的三维形状和姿势这一具有挑战性的问题,本文作者利用狗的品种信息制定了新的损失,以提高模型的预测准确性。结果表明BARC生成的狗明显更真实。这项工作揭示了遗传相似性的先验信息有助于弥补3D训练数据的不足问题。

论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Ruegg_BARC_Learning_To_Regress_3D_Dog_Shape_From_Images_by_CVPR_2022_paper.pdf

本文的目标是从单一的图像恢复狗的三维形状和姿势。这是一项具有挑战性的任务,因为狗表现出各种各样的形状和外观。最近的工作提出了用额外的肢体尺度参数从图像中直接回归SMAL动物模型。本文的方法BARC在几个重要的方面超越了之前的工作。首先,作者修改了SMAL的形状空间,使其更适合表示狗的形状。但是,即使有了更好的形状模型,从图像中回归狗的形状问题仍然具有挑战性,因为缺乏具有3D地面真实性 (ground truth)的配对图像。为了弥补配对数据的缺失,作者利用狗的品种信息制定了新的损失。特别地,作者利用同一品种的狗有着相似的体型这一事实,提出了一种新的品种相似性损失,包括两个部分:来自同一品种的狗的形状比不同品种的狗更相似。第二个是品种分类损失,有助于产生可识别的品种特定形状。消融实验的结果表明品种损失显著提高了形状的准确性。作者还通过感知研究对BARC和WLDO进行了定性比较,发现BARC生成的狗明显更真实。这项工作表明,遗传相似性的先验信息有助于弥补3D训练数据的不足。这个概念可能适用于其他动物物种或物种群。

内容中包含的图片若涉及版权问题,请及时与我们联系删除