PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction

2024年07月24日
  • 简介
    时间信息对于检测被遮挡的实例至关重要。现有的时间表示已经从BEV或PV特征进展到更紧凑的查询特征。与上述特征相比,预测提供了最高级别的抽象,提供了明确的信息。在在线矢量化高清地图构建的背景下,预测的这种独特特性在长期时间建模和地图先验整合方面具有潜在优势。本文介绍了PrevPredMap,这是一种开创性的时间建模框架,利用以前的预测来构建在线矢量化高清地图。我们为PrevPredMap精心设计了两个关键模块:基于先前预测的查询生成器和动态位置查询解码器。具体而言,基于先前预测的查询生成器旨在单独编码来自先前预测的不同类型信息,然后由动态位置查询解码器有效地利用这些信息来生成当前预测。此外,我们开发了双模式策略,以确保PrevPredMap在单帧模式和时间模式下的强大性能。广泛的实验表明,PrevPredMap在nuScenes和Argoverse2数据集上实现了最先进的性能。代码将可在https://github.com/pnnnnnnn/PrevPredMap上获得。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决在线构建矢量化高清地图的问题,通过利用先前的预测信息进行长期时间建模和地图先验整合。
  • 关键思路
    本文提出了PrevPredMap框架,利用先前的预测信息进行在线矢量化高清地图构建。该框架包括两个核心模块:基于先前预测的查询生成器和动态位置查询解码器。前者将先前预测的不同类型信息分别编码,后者利用这些信息生成当前预测。此外,本文还开发了双模式策略,确保PrevPredMap在单帧和时间模式下均具有鲁棒性。
  • 其它亮点
    本文在nuScenes和Argoverse2数据集上进行了广泛实验,结果表明PrevPredMap在预测精度方面达到了最先进水平。此外,本文提供了开源代码。
  • 相关研究
    最近在这个领域中,还有一些相关研究,如《Complex-YOLO: Real-time 3D Object Detection on Point Clouds》、《PointPillars: Fast Encoders for Object Detection from Point Clouds》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问