Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving

Proceedings of the Irish Machine Vision and Image Processing Conference 2024
2024年07月23日
  • 简介
    本研究探究了现代可变形卷积神经网络(DCNNs)在语义分割任务中的有效性,特别是针对具有鱼眼图像的自动驾驶场景。这些图像提供了广阔的视野,但由于物体属性的动态变化,提取空间和几何信息面临着独特的挑战。我们的实验集中在将WoodScape鱼眼图像数据集分割成十个不同的类别,评估可变形网络捕捉复杂空间关系和提高分割准确性的能力。此外,我们探索了不同的损失函数来解决类别不平衡问题,并比较了传统CNN架构与基于可变形卷积的CNN,包括Vanilla U-Net和Residual U-Net架构的性能。集成可变形CNNs导致的mIoU得分的显着提高,证明了它们在处理鱼眼图像中存在的几何扭曲方面的有效性,超过了传统CNN架构的性能。这凸显了可变形卷积在增强鱼眼图像的语义分割性能方面的重要作用。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在研究现代变形卷积神经网络(DCNNs)在语义分割任务中的有效性,特别是在自动驾驶场景中使用鱼眼图像。
  • 关键思路
    论文的关键思路是使用变形卷积神经网络(DCNNs)来解决鱼眼图像中的几何失真问题,从而提高语义分割的准确性。
  • 其它亮点
    论文使用了WoodScape鱼眼图像数据集进行实验,比较了传统CNN架构和基于变形卷积的CNN架构的性能差异,还探索了不同的损失函数来解决类别不平衡问题。实验结果表明,使用变形卷积神经网络可以显著提高语义分割的准确性。
  • 相关研究
    在这个领域中,最近的相关研究包括:《Fisheye-to-Equirectangular: A Real-Time, Deep Learning-Based Solution》、《Fisheye Image Rectification and Calibration Based on Deep Learning》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问