SeaBird: Segmentation in Bird's View with Dice Loss Improves Monocular 3D Detection of Large Objects

2024年03月29日
  • 简介
    本文中,单目三维检测器在汽车和较小物体上表现出色。然而,在较大物体上,它们的性能下降,导致了致命的事故。一些人将这些失败归因于训练数据的稀缺性或对大型物体的感受野要求。在本文中,我们强调了这个未被充分研究的大型物体泛化问题。我们发现,即使在几乎平衡的数据集上,现代前置检测器也难以泛化到大型物体。我们认为失败的原因是深度回归损失对大型物体噪声的敏感性。为了弥补这个差距,我们全面研究了回归损失和Dice损失,并研究它们在不同误差水平和物体尺寸下的鲁棒性。我们在一个简化的情况下数学证明了Dice损失相对于回归损失在大型物体的噪声鲁棒性和模型收敛方面具有优越性。利用我们的理论洞见,我们提出了SeaBird(鸟瞰图中的分割)作为通往大型物体泛化的第一步。SeaBird有效地将BEV分割与3D检测中的前景物体相结合,并使用Dice损失训练分割头。SeaBird在KITTI-360排行榜上取得了SoTA结果,并改进了现有检测器在nuScenes排行榜上的表现,特别是对于大型物体。代码和模型位于 https://github.com/abhi1kumar/SeaBird。
  • 图表
  • 解决问题
    论文试图解决现有的单目3D检测器在大型物体上的表现下降问题,探究其泛化能力差的原因。
  • 关键思路
    论文提出了SeaBird(基于鸟瞰图的分割)方法,将BEV分割与3D检测相结合,使用Dice Loss训练分割头,以提高大型物体的噪声鲁棒性和模型收敛性。
  • 其它亮点
    SeaBird在KITTI-360排行榜上取得了SoTA结果,在nuScenes排行榜上改进了现有的检测器,特别是对于大型物体。论文使用了多个数据集进行实验,并在GitHub上开源了代码和模型。
  • 相关研究
    相关研究包括Monocular 3D detectors、使用不同的损失函数进行训练的方法、以及其他基于鸟瞰图的方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论