论文标题:Multi-Modal 3D Object Detection in Autonomous Driving: a Survey

论文链接:https://arxiv.org/abs/2106.12735

作者单位:中国科学技术大学

34页综述,共计250+篇参考文献!本文对多模态的3D目标检测深度学习模型进行全面调研(尤其是相机和LiDAR的融合),系统介绍了经典和最新的算法,以及技术发展路线,还盘点了主流数据集!

过去几年,我们见证了自动驾驶的快速发展。然而,由于复杂和动态的驾驶环境,实现完全自主仍然是一项艰巨的任务。因此,自动驾驶汽车配备了一套传感器来进行强大而准确的环境感知。随着传感器的数量和类型不断增加,将它们结合起来以获得更好的感知正在成为一种自然趋势。到目前为止,还没有针对基于多传感器融合的感知进行深入审查。为了弥合这一差距并推动未来的研究,本次调查致力于回顾最近利用多个传感器数据源(尤其是相机和 LiDAR)的基于融合的 3D 检测深度学习模型。在本次调查中,我们首先介绍了用于自动驾驶汽车的流行传感器的背景,包括它们的通用数据表示以及为每种类型的传感器数据开发的目标检测网络。接下来,我们讨论一些用于多模态3D目标检测的流行数据集,特别关注每个数据集中包含的传感器数据。然后我们通过考虑融合的以下三个方面来深入回顾最近的多模态3D检测网络:融合位置、融合数据表示和融合粒度。经过详细审查后,我们将讨论公开的挑战并指出可能的解决方案。我们希望我们的详细评论可以帮助研究人员开始多模态3D目标检测领域的研究。

内容中包含的图片若涉及版权问题,请及时与我们联系删除