- 简介目前,高清地图构建趋向于轻量级在线生成,旨在保留及时可靠的道路场景信息。然而,地图元素包含强烈的形状先验知识。当前基于检测的框架中,微小且稀疏的注释使得定位相关特征范围变得模糊,并导致预测中丢失详细结构。为了缓解这些问题,我们提出了MGMap,一种掩模引导的方法,通过引入学习到的掩模,有效地突出信息丰富的区域,并实现精确的地图元素定位。具体而言,MGMap基于两个方面的增强多尺度BEV特征使用学习到的掩模。在实例级别上,我们提出了掩模激活实例(MAI)解码器,通过激活实例掩模将全局实例和结构信息纳入实例查询。在点级别上,设计了一种新的位置引导掩模补丁细化(PG-MPR)模块,以更细粒度的角度对点位置进行细化,使得可以提取特定于点的补丁信息。与基线相比,我们提出的MGMap在不同的输入模式下实现了约10个mAP的显著改进。广泛的实验还表明,我们的方法展示了强大的鲁棒性和泛化能力。我们的代码可以在https://github.com/xiaolul2/MGMap找到。
- 图表
- 解决问题本论文旨在解决高清地图构建中存在的问题,即当前检测模型无法准确定位相关特征区域,导致预测结果缺乏细节结构。
- 关键思路本论文提出了一种名为MGMap的掩模引导方法,通过引入学习到的掩模实现有效的信息突出和精确的地图元素定位。具体来说,MGMap从两个角度利用增强的多尺度BEV特征进行学习掩模,即在实例级别上采用掩模激活实例解码器(MAI),在点级别上设计了一种新的位置引导掩模补丁细化(PG-MPR)模块,以从更细粒度的角度优化点位置,并提取点特定的补丁信息。
- 其它亮点实验结果表明,相比基线模型,MGMap在不同输入模态下均实现了显著提升,约为10 mAP。此外,MGMap具有较强的鲁棒性和泛化能力。论文提供了开源代码,代码链接为https://github.com/xiaolul2/MGMap。
- 与本论文相关的研究包括:1. Y. Li等人的“HDMapNet: An End-to-End Learning Framework for High-Definition Map Generation Using Multiple Sensors”;2. J. Zhang等人的“DeepLMP: Deep Local Map Prediction for Autonomous Driving with Crowdsourced Data”;3. J. Chen等人的“Multi-Task Learning for High-Definition Map and Continuous Ego-Motion Estimation”等。
沙发等你来抢
去评论
评论
沙发等你来抢