Reparameterizable Dual-Resolution Network for Real-time Semantic Segmentation

2024年06月18日
  • 简介
    本文介绍了语义分割在自动驾驶和医学图像等应用中的关键作用。虽然现有的实时语义分割模型在准确性和速度之间取得了可观的平衡,但它们的多路径块仍然影响了整体速度。为了解决这个问题,本研究提出了一种专门用于实时语义分割的可重参数双分辨率网络(RDRNet)。具体来说,RDRNet采用了双分支架构,在训练过程中使用多路径块,而在推理过程中将它们重新参数化为单路径块,从而同时提高准确性和推理速度。此外,我们还提出了可重参数金字塔池化模块(RPPM),以增强金字塔池化模块的特征表示能力,而不会增加其推理时间。在Cityscapes、CamVid和Pascal VOC 2012数据集上的实验结果表明,RDRNet在性能和速度方面均优于现有的最先进模型。代码可在https://github.com/gyyang23/RDRNet上获得。
  • 图表
  • 解决问题
    提高实时语义分割模型的速度和精度
  • 关键思路
    使用Reparameterizable Dual-Resolution Network (RDRNet)和Reparameterizable Pyramid Pooling Module (RPPM)来提高速度和精度
  • 其它亮点
    RDRNet使用双分支架构,在训练时使用多路径块,在推断时将其重新参数化为单路径块,同时提高准确性和推断速度。RPPM用于增强金字塔池化模块的特征表示而不增加推断时间。在Cityscapes、CamVid和Pascal VOC 2012数据集上的实验结果表明,RDRNet在性能和速度方面均优于现有的最先进模型。代码已开源。
  • 相关研究
    与此相关的其他研究包括FastFCN、SwiftNet、ESPNetv2等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论