论文标题:Reviving Iterative Training with Mask Guidance for Interactive Segmentation 论文链接:https://arxiv.org/abs/2102.06583 代码链接:https://github.com/saic-vul/ritminteractivesegmentation 作者单位:三星电子(视觉理解实验室) 表现SOTA!性能优于BRS、FCA-Net等网络,代码刚刚开源!

基于点击的交互式分割的最新工作已通过使用各种推理时间优化方案展示了最新的结果。与前馈方法相比,这些方法在计算上要昂贵得多,因为它们需要在推理过程中通过网络执行后向传递,并且很难部署在通常仅支持前向传递的移动框架上。在本文中,我们广泛评估了交互式分割的各种设计选择,并发现无需任何其他优化方案即可获得最新的技术成果。因此,我们为基于点击的交互式分割提出了一个简单的前馈模型,该模型采用了先前步骤中的分割mask。它不仅可以分割一个全新的对象,还可以从一个外部蒙版开始对其进行校正。在分析在不同数据集上训练的模型的性能时,我们观察到训练数据集的选择会极大地影响交互式分割的质量。我们发现,结合了COCO和LVIS的训练模型具有多样化和高质量的注释,其性能优于所有现有模型。

内容中包含的图片若涉及版权问题,请及时与我们联系删除