上海AI实验室与商汤等最新《鸟瞰图视觉感知》综述,26页pdf阐述BEV最新方法与评价。

图片

论文链接:https://arxiv.org/abs/2209.05324

从鸟瞰视角学习感知任务中的强表示是当前业界和学术界广泛关注的一个趋势。大多数自动驾驶算法的传统方法都是在正面或透视视图中执行检测、分割、跟踪等。随着传感器配置越来越复杂,集成来自不同传感器的多源信息并在统一视图中表示特征变得至关重要。BEV感知继承了几个优点,因为在BEV中表示周围的场景是直观的和友好的融合;和在BEV中表示对象是最可取的后续模块,如规划和/或控制。BEV感知的核心问题在于: (a) 如何通过透视视图到BEV的视图转换重建丢失的三维信息; (b)如何获取BEV网格中的真实注释; (c)如何制定整合不同来源和不同观点特色的途径;以及(d)当传感器配置在不同场景中不同时,如何适应和推广算法。本综述回顾了关于BEV感知的最新工作,并对不同的解决方案进行了深入分析。此外,还描述了业界对BEV方法的几种系统设计。此外,我们还介绍了一整套实用指南来提高BEV感知任务的性能,包括相机、激光雷达和融合输入。最后,指出了该领域未来的研究方向。我们希望这份报告能对社区有所启发,并鼓励对BEV感知进行更多的研究。我们有一个活跃的存储库来收集最新的工作,并在

https://github.com/OpenPerceptionX/BEVPerception-Survey-Recipe上提供了一个工具箱。

内容中包含的图片若涉及版权问题,请及时与我们联系删除