Sparse Laneformer

2024年04月11日
  • 简介
    车道检测是自动驾驶中的基本任务,随着深度学习的出现,已经取得了巨大进展。以往的基于锚点的方法通常设计密集的锚点,这高度依赖于训练数据集,并且在推理过程中保持不变。我们分析发现,车道检测并不需要密集的锚点,因此提出了一种基于稀疏锚点机制的变换器车道检测框架。为此,我们使用位置感知车道查询和角度查询生成稀疏锚点,而不是传统的显式锚点。我们采用水平感知注意力(HPA)沿水平方向聚合车道特征,并采用车道-角度交叉注意力(LACA)在车道查询和角度查询之间进行交互。我们还提出了基于可变形交叉注意力的车道感知注意力(LPA),以进一步细化车道预测结果。我们的方法名为Sparse Laneformer,易于实现且可端到端训练。广泛的实验证明,Sparse Laneformer在CULane数据集上的性能优于现有的最先进方法,例如,在使用相同的ResNet-34骨干网络的情况下,F1分数比Laneformer高3.0%,比O2SFormer高0.7%,并且MAC更少。
  • 作者讲解
  • 图表
  • 解决问题
    本文试图提出一种基于稀疏锚机制的变形器(Transformer)车道检测框架,以解决车道检测中锚点密集度高、依赖训练数据集、推理时不变等问题。
  • 关键思路
    本文提出了一种新的稀疏锚机制,通过位置感知车道查询和角度查询生成稀疏锚点,采用水平感知注意力和车道-角度交叉注意力进行车道特征聚合和交互,同时引入基于变形注意力的车道感知注意力进行进一步的车道预测优化。
  • 其它亮点
    本文提出的Sparse Laneformer方法易于实现,可端到端训练,实验结果表明其在CULane数据集上优于当前最先进的Laneformer和O2SFormer方法,同时MAC数量更少。此外,本文还提供了开源代码。
  • 相关研究
    最近在车道检测领域的相关研究包括:1. LaneATT: Lane Attentional Multi-Task Learning for Autonomous Driving 2. SCNN: Spatial As Deep: Spatial CNN for Traffic Scene Understanding 3. SAD: Sliding Shapes for 3D Object Detection in Depth Images
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问