论文标题:Segmenting Transparent Object in the Wild with Transformer 论文链接:https://arxiv.org/abs/2101.08461 作者单位:香港大学 & 商汤科技 表现SOTA!性能优于PSPNet、DANet和DeepLabv3+等网络。

这项工作提出了一个新的细粒度透明物体分割数据集,称为Trans10K-v2,它扩展了第一个大规模透明物体分割数据集Trans10K-v1。与Trans10K-v1仅具有两个有限的类别不同,我们的新数据集具有许多吸引人的好处。 (1)它具有11种细粒度类别的透明对象,通常在人类家庭环境中出现,使其在实际应用中更加实用。 (2)Trans10K-v2给当前的高级分割方法带来了比以前的版本更多的挑战。此外,提出了一种新颖的基于transformer的分割pipeline,称为Trans2Seg。首先,与CNN的局部感受野相比,Trans2Seg的transformer编码器提供了全局感受野,与纯CNN架构相比,它具有出色的优势。其次,通过将语义分割公式化为字典查找问题,我们设计了一组可学习的原型作为Trans2Seg的Translator解码器的查询,其中每个原型都学习整个数据集中一个类别的统计信息。我们对20多种最新的语义分割方法进行了基准测试,证明Trans2Seg的性能明显优于所有基于CNN的方法,从而表明了该算法解决透明物体分割的潜在能力。

内容中包含的图片若涉及版权问题,请及时与我们联系删除