Improving Distant 3D Object Detection Using 2D Box Supervision

2024年03月14日
  • 简介
    提高远距离三维物体检测的准确性是一项重要而具有挑战性的任务。对于基于相机的三维感知,三维边界框的标注很大程度上依赖于LiDAR提供精确的深度信息。因此,由于远距离物体上LiDAR点的稀疏性,标注的距离通常受到限制,这限制了现有检测器在长距离场景下的能力。我们通过仅考虑远距离物体的2D边界框监督来解决这一挑战,因为它们易于标注。我们提出了LR3D框架,该框架学习恢复远距离物体的缺失深度。LR3D采用隐式投影头来学习生成2D边界框和深度之间的映射,使用近距离物体上的三维监督。这种映射允许在给定2D边界框的条件下估计远距离物体的深度,从而使得使用2D监督进行长距离三维检测成为可能。实验表明,在没有远距离三维标注的情况下,LR3D使基于相机的方法能够以与完整三维监督相当的准确度检测远距离物体(超过200米)。我们的框架是通用的,并且可以广泛地惠及3D检测方法。
  • 图表
  • 解决问题
    如何在缺乏深度信息的情况下,提高远距离三维物体检测的准确性?
  • 关键思路
    使用仅有的二维边界框标注信息,通过学习近距离物体的三维信息,推断出远距离物体的深度信息,并结合二维边界框信息进行三维物体检测。
  • 其它亮点
    论文提出的LR3D框架可以在缺乏远距离三维标注信息的情况下,通过仅有的二维边界框标注信息,实现远距离三维物体检测。实验结果表明,LR3D可以在200米以上的距离内检测到物体,并且与使用完整三维标注信息的方法相比,准确率相当。该框架具有普适性,可以广泛地应用于三维物体检测领域。
  • 相关研究
    近期的相关研究包括:'MonoDIS: Monocular 3D Object Detection in the Wild','Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression'等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论