【推荐理由】本文采用多元高斯方法去改进单张图像深度预测,并在KITTI深度预测基准排行榜上排名前列。

Single Image Depth Prediction Made Better: A Multivariate Gaussian Take

Ce Liu, Suryansh Kumar, Shuhang Gu, Radu Timofte, Luc Van Gool

[CVL ETH Zurich]

【论文链接】https://arxiv.org/pdf/2303.18164.pdf

【项目链接】https://www.cvlibs.net/datasets/kitti/eval_depth.php?benchmark=depth_prediction

【摘要】基于神经网络的单张图像深度预测(SIDP)是一个具有挑战性的任务,其目标是在测试时预测场景的每个像素的深度。由于问题本质上是不适定的,因此基本目标是提出一种可靠地从一组训练样例中建模场景深度的方法。在追求完美深度估计的过程中,大多数现有的最先进学习技术预测每个像素的单个标量深度值。然而,众所周知,训练的模型具有精度限制,并且可能会预测不精确的深度。因此,SIDP方法必须注意模型在测试时的预测深度变化。因此,本文引入了一种连续建模每个像素深度的方法,可以预测和推理每个像素深度及其分布。为此,作者使用多元高斯分布对每个像素场景深度进行建模。此外,与现有的不确定性建模方法相反,其中假定每个像素深度是独立的,文章引入了每个像素协方差建模,以编码其深度依赖性相对于所有场景点的关系。不幸的是,每个像素深度协方差建模会导致计算上昂贵的连续损失函数,文章使用学习的总体协方差矩阵的低秩近似有效地解决了这个问题。值得注意的是,在基准数据集(如KITTI、NYU和SUN-RGB-D)上进行测试时,通过优化损失函数获得的SIDP模型显示出最先进的结果。该方法的准确性(称为MG)在KITTI深度预测基准排行榜上排名前列。

内容中包含的图片若涉及版权问题,请及时与我们联系删除