- 简介计算机视觉技术在自动驾驶汽车的感知系统中发挥着核心作用,用于通过传感器数据感知车辆周围环境。3D LiDAR传感器通常用于从场景中收集稀疏的3D点云数据。然而,与人类感知相比,这些系统难以推断出场景中未被观测到的部分。在这方面,场景完成任务旨在预测LiDAR测量中的缺口,以实现更完整的场景表示。鉴于最近扩散模型作为图像生成模型的良好结果,我们提出将其扩展到从单个3D LiDAR扫描中实现场景完成。以往的研究使用扩散模型处理从LiDAR数据中提取的距离图像,直接应用基于图像的扩散方法。与众不同的是,我们提出直接对点进行操作,重新制定噪声和去噪扩散过程,使其能够有效地在场景尺度上工作。除了我们的方法,我们提出了一个正则化损失来稳定去噪过程中预测的噪声。我们的实验评估表明,我们的方法可以完成给定单个LiDAR扫描作为输入的场景,与最先进的场景完成方法相比,产生了更多细节的场景。我们相信,我们提出的扩散过程公式可以支持进一步研究扩散模型应用于场景尺度的点云数据。
- 图表
- 解决问题本文旨在解决自动驾驶技术中的场景感知问题,即如何通过3D LiDAR数据完成场景感知中的缺失部分。这是否是一个新问题?
- 关键思路本文提出了一种基于扩散模型的点云场景补全方法,通过对点云噪声和去噪过程的重新定义,实现了对单个3D LiDAR扫描的场景补全。相比现有的基于图像的扩散模型方法,本文的方法可以直接操作点云,适用于场景尺度的点云数据。
- 其它亮点本文提出的方法在单个3D LiDAR扫描的场景补全上表现出色,相比现有的方法更能还原场景细节。此外,本文还提出了一种正则化损失以稳定去噪过程中的噪声预测。实验使用了公开数据集,但未开源代码。本文的方法可以为基于扩散模型的点云场景补全研究提供新思路。
- 近期的相关研究包括:1.《Point Cloud Completion using a Point Transformer Network》;2.《Voxel-Transformer Networks for 3D Point Cloud Analysis》;3.《Deep LiDAR Completion for 3D Object Detection in Autonomous Driving》等。
沙发等你来抢
去评论
评论
沙发等你来抢