论文标题:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes 论文链接:https://arxiv.org/abs/2101.06085 作者单位:哈尔滨工业大学 表现SOTA!其中DDRNet一个版本Cityscapes test上达到109 FPS / 77.4%mIoU!太强了!综合性能优于SFNet、MSFNet和BiSeNetV2等网络。
语义分割是自动驾驶汽车了解周围场景的一项关键技术。对于实际的自动驾驶车辆,不希望花费大量的推理时间来获得高精度的分割结果。使用轻量级架构(编码器-解码器或两条路径)或对低分辨率图像进行推理,最近的方法实现了非常快速的场景解析,甚至在单个1080Ti GPU上以超过100 FPS的速度运行。但是,这些实时方法和基于膨胀主干的模型之间在性能上仍存在明显差距。为了解决这个问题,我们提出了新颖的深度双分辨率网络(DDRNet),用于道路场景的实时语义分割。此外,我们设计了一个新的上下文信息提取器,称为深度聚合金字塔合并模块(DAPPM),以扩大有效的感受野并融合多尺度上下文。我们的方法在Cityscapes和CamVid数据集上都在精度和速度之间实现了最新的最新折衷。特别是,在单个2080Ti GPU上,DDRNet-23-slim在109 FPS的Cityscapes test上达到77.4%的mIoU,在230 FPS的情况下在CamVid test set上可产生74.4%的mIoU。 DDRNet-39在没有利用注意力机制,未对较大的语义分割数据集进行预训练或推理加速的情况下,在Cityscapes上以23 FPS的速度达到80.4%的测试mIoU。通过广泛使用的测试扩充,我们的方法仍优于大多数最新模型,所需的计算量更少。代码和训练有素的模型将公开提供。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢