BSNet: Box-Supervised Simulation-assisted Mean Teacher for 3D Instance Segmentation

2024年03月22日
  • 简介
    3D实例分割(3DIS)是一项关键任务,但在完全监督的情况下,点级注释是繁琐的。因此,使用边界框(bboxes)作为注释已显示出巨大的潜力。目前主流的方法是一个两步过程,涉及从框注释生成伪标签和使用伪标签训练3DIS网络。然而,由于bboxes之间存在交叉,不是每个点都有确定的实例标签,特别是在重叠区域。为了生成更高质量的伪标签并实现更精确的弱监督3DIS结果,我们提出了Box-Supervised Simulation-assisted Mean Teacher for 3D Instance Segmentation(BSNet),它设计了一种名为Simulation-assisted Transformer的新型伪标签生成器。标注器由两个主要组件组成。第一个是Simulation-assisted Mean Teacher,它首次在此任务中引入了Mean Teacher,并构建了模拟样本来帮助标注器获取有关重叠区域的先前知识。为了更好地建模局部-全局结构,我们还提出了局部-全局感知注意力作为教师和学生标注器的解码器。在ScanNetV2和S3DIS数据集上进行的广泛实验验证了我们设计的优越性。代码可在\href{https://github.com/peoplelu/BSNet}{https://github.com/peoplelu/BSNet}上找到。
  • 图表
  • 解决问题
    本论文旨在解决3D实例分割中使用边界框作为注释的问题,提出了一种新的伪标签生成方法,以实现更精确的弱监督3D实例分割结果。
  • 关键思路
    论文提出了一种名为BSNet的方法,其中包括一个新的伪标签生成器——Simulation-assisted Transformer,以及一个用于获取重叠区域先验知识的模拟样本构建器——Simulation-assisted Mean Teacher。此外,还提出了一种局部-全局感知注意力解码器,以更好地建模局部和全局结构。
  • 其它亮点
    论文在ScanNetV2和S3DIS数据集上进行了广泛的实验,证明了BSNet方法的优越性。此外,论文提供了开源代码。
  • 相关研究
    在这个领域中,最近的相关研究包括:Weakly Supervised 3D Object Detection from Lidar Point Cloud和End-to-End Learning of Multi-Sensor 3D Object Detection from Point Clouds。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论