Mask2Map: Vectorized HD Map Construction Using Bird's Eye View Segmentation Masks

2024年07月18日
  • 简介
    本文介绍了一种新颖的端到端在线高清地图构建方法Mask2Map,专为自动驾驶应用而设计。我们的方法侧重于在鸟瞰图中预测场景内地图实例的类别和有序点集。Mask2Map由两个主要组件组成:实例级掩模预测网络(IMPNet)和掩模驱动的地图预测网络(MMPNet)。IMPNet生成掩模感知查询和BEV分割掩模,以全局方式捕获综合语义信息。随后,MMPNet通过两个子模块(位置查询生成器(PQG)和几何特征提取器(GFE))使用局部上下文信息增强这些查询特征。PQG通过将BEV位置信息嵌入掩模感知查询来提取实例级位置查询,而GFE利用BEV分割掩模生成点级几何特征。然而,我们观察到Mask2Map的性能受到了不同预测与Ground Truth(GT)匹配之间的网络不一致性的限制。为了解决这个挑战,我们提出了Inter-network Denoising Training方法,指导模型去除受到嘈杂的GT查询和扰动的GT分割掩模影响的输出。我们在nuScenes和Argoverse2基准测试上进行的评估表明,Mask2Map相对于先前的最先进方法取得了显着的性能提升,分别为10.1% mAP和4.1 mAP。我们的代码可在https://github.com/SehwanChoi0307/Mask2Map找到。
  • 图表
  • 解决问题
    Mask2Map论文旨在提出一种新的端到端在线高清地图构建方法,用于自动驾驶应用。
  • 关键思路
    Mask2Map由两个主要组件组成:Instance-Level Mask Prediction Network(IMPNet)和Mask-Driven Map Prediction Network(MMPNet)。IMPNet生成Mask-Aware Queries和BEV Segmentation Masks,以全局方式捕捉全面的语义信息。随后,MMPNet通过两个子模块(Positional Query Generator(PQG)和Geometric Feature Extractor(GFE))利用局部上下文信息增强这些查询特征。
  • 其它亮点
    论文提出了Inter-network Denoising Training方法,以解决由于IMPNet和MMPNet之间不一致的问题导致的性能限制。在nuScenes和Argoverse2基准测试上进行的评估表明,Mask2Map相比之前的最先进方法取得了显着的性能提升。作者还提供了开源代码。
  • 相关研究
    在这个领域中,最近的相关研究包括:"RoadTracer: Automatic Extraction of Road Networks from Aerial Images","DeepRoadMapper: Extracting Road Topology from Aerial Images","DeepGlobe Road Extraction Challenge"等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论