- 简介从二维图像中估计深度是一项常见的计算机视觉任务,它在许多领域中都有应用,包括自动驾驶、场景理解和机器人技术。监督式深度估计方法的准确性主要取决于所选的损失函数、模型架构、数据质量和性能指标。在本研究中,我们提出了一种简化和可适应的方法,利用迁移学习和优化损失函数来提高深度估计的准确性。优化的损失函数是一组加权损失函数的组合,可以增强鲁棒性和泛化性:平均绝对误差(MAE)、边缘损失和结构相似性指数(SSIM)。我们使用网格搜索和随机搜索方法来寻找最优权重,从而得到改进的模型。我们探索了多个基于编码器-解码器的模型,包括DenseNet121、DenseNet169、DenseNet201和EfficientNet,用于对NYU深度数据集v2进行监督式深度估计模型。我们观察到,EfficientNet模型在使用ImageNet进行分类预训练时作为编码器,配合简单的上采样解码器,在RSME、REL和log10方面都取得了最佳结果:分别为0.386、0.113和0.049。我们还进行了定性分析,说明我们的模型产生的深度图与真实值非常接近,即使真实值存在缺陷的情况下也是如此。结果表明,准确性和鲁棒性都有显著提高,其中EfficientNet是最成功的架构。
- 图表
- 解决问题提高深度估计准确性的简化和可适应方法
- 关键思路使用迁移学习和优化的损失函数相结合的方法来提高深度估计准确性
- 其它亮点使用多种编码器-解码器模型进行实验,包括DenseNet和EfficientNet,通过网格搜索和随机搜索方法找到最优权重,提高模型性能;使用优化的损失函数,包括MAE、Edge Loss和SSIM的组合,提高模型的鲁棒性和泛化性;在NYU Depth Dataset v2上进行实验,发现EfficientNet模型作为编码器,配合简单的上采样解码器,取得了最佳结果
- 近期的相关研究包括: 1. Deep Convolutional Neural Networks for Depth Estimation from a Single Image (2016) 2. Learning Depth from Monocular Videos using Direct Methods (2018) 3. Unsupervised Monocular Depth Estimation with Left-Right Consistency (2017)
沙发等你来抢
去评论
评论
沙发等你来抢