Rethinking Inductive Biases for Surface Normal Estimation

2024年03月01日
  • 简介
    尽管准确的表面法线估计模型需求不断增长,现有的方法使用通用的密集预测模型,采用与其他任务相同的归纳偏差。本文讨论了表面法线估计所需的归纳偏差,并提出了两种方法:(1)利用每个像素的射线方向,(2)通过学习相邻表面法线的相对旋转来编码它们之间的关系。所提出的方法可以为任意分辨率和宽高比的具有挑战性的野外图像生成清晰而又分段平滑的预测。与最近的基于ViT的最先进模型相比,我们的方法表现出更强的泛化能力,尽管训练数据集的规模小了几个数量级。代码可在https://github.com/baegwangbin/DSINE上获得。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在讨论表面法线估计所需的归纳偏差,并提出了使用每像素射线方向和学习相邻表面法线之间的相对旋转来编码它们之间关系的方法。同时,该方法旨在在任意分辨率和纵横比的具有挑战性的野外图像中生成清晰而分段平滑的预测。
  • 关键思路
    本文提出的方法是利用每像素射线方向和学习相邻表面法线之间的相对旋转来编码它们之间关系,以生成清晰而分段平滑的预测。相比于现有的基于密集预测模型的方法,该方法具有更强的泛化能力,尽管使用的数据集规模小得多。
  • 其它亮点
    本文的实验结果表明,所提出的方法在表面法线估计任务中具有更好的性能。此外,该方法使用的数据集规模比现有方法小得多,同时实验结果也表明该方法具有更强的泛化能力。作者还提供了开源代码。
  • 相关研究
    近期的相关研究包括:《Depth from a Single Image by Harmonizing Overcomplete Local Network Predictions》、《Deep Learning for Single Image Super-Resolution: A Brief Review》、《Unsupervised Learning of Depth and Ego-Motion from Video》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问