Hierarchical Neural Architecture Search for Deep Stereo Matching 论文链接:https://arxiv.org/abs/2010.13501 代码链接:https://github.com/XuelianCheng/LEAStereo 第一个基于NAS的深度立体匹配网络,一个月前在KITTI上准确性排名第一!(目前排名第二),性能优于AANet、AutoDispNet等网络,代码现已开源!作者单位:莫纳什大学, 澳大利亚国立大学等

为了减少人工在神经网络设计中的工作,神经网络架构搜索(NAS)已成功地应用于各种高级视觉任务,例如分类和语义分割。NAS算法的基本思想很简单,即,为了使网络能够在一组操作(例如,具有不同过滤器大小的卷积)之间进行选择,人们便能够找到更适合该问题的最佳架构。在眼前。但是,到目前为止,NAS的成功还没有通过诸如立体匹配之类的low-level几何视觉任务获得。这部分是由于以下事实:由人类设计的最先进的深度立体匹配网络已经具有庞大的规模。基于当前可用的主流计算资源,将NAS直接应用于如此庞大的结构在计算上是令人望而却步的。在本文中,我们通过将特定于任务的人类知识整合到神经体系结构搜索框架中,提出了第一个用于深度立体匹配的端到端分层NAS框架。具体来说,遵循用于深度立体匹配的黄金标准pipeline(即特征提取-特征体积构建和密集匹配),我们共同优化了整个pipeline的架构。广泛的实验表明,我们搜索到的网络优于所有最新的深度立体匹配架构,在KITTI stereo2012、2015和Middlebury基准测试中,其准确性均名列第一;在SceneFlow数据集中,其准确性最高。网络规模和推理速度的改善。

内容中包含的图片若涉及版权问题,请及时与我们联系删除