论文标题:RGB-D Salient Object Detection via 3D Convolutional Neural Networks 论文链接:https://arxiv.org/abs/2101.10241 代码链接:https://github.com/PPOLYpubki/RD3D 作者单位:中国科学技术大学, 四川大学 本文是首次尝试通过3D CNNs解决RGB-D SOD的工作,提出的RD3D模型旨在在编码器阶段进行预融合,在解码器阶段进行深度融合,表现SOTA!性能优于JL-DCF、DANet等,代码即将开源!

RGB-D显著性目标检测(SOD)最近引起了越来越多的研究兴趣,并且出现了许多基于编码器-解码器体系结构的深度学习方法。但是,大多数现有的RGB-D SOD模型都在单个编码器或解码器阶段进行特征融合,这几乎不能保证足够的跨模态融合能力。在本文中,我们首次尝试通过3D卷积神经网络解决RGB-D SOD。所提出的名为RD3D的模型旨在在编码器阶段进行预融合,在解码器阶段进行深度融合,以有效促进RGB和深度流的完全集成。具体来说,RD3D首先通过膨胀的3D编码器在RGB和深度模态上进行预融合,然后通过设计配备有丰富的反投影路径(RBPP)的3D解码器来提供深度特征融合,以利用3D的广泛聚合能力卷积。通过这种同时涉及编码器和解码器的渐进融合策略,可以利用两种模态之间有效而彻底的交互作用并提高检测精度。在六个广泛使用的基准数据集上进行的广泛实验表明,相对于14个最新的RGB-D SOD方法,RD3D在四个关键评估指标方面的表现均令人满意。

内容中包含的图片若涉及版权问题,请及时与我们联系删除