本文介绍在 ICCV 2021 LVIS Challenge Workshop上的冠军解决方案:『LVIS Challenge Track Technical Report: Distribution Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation』

论文链接:

https://www.lvisdataset.org/assets/challenge_reports/2021/FuXi-Fresher_v2.pdf

如果说这次比赛中我学到了什么,我想我感触最深的就是合作共赢和Swin Transformer的范式创新吧,再有就是要感谢mmdetection的开发人员。合作共赢是我这一次竞赛最大的感悟,这次比赛是我与优图实验室的另一位算法研究员一同参与的,作为我们迈入职场的第一项工作,也是对我们在实例分割方向学习一段时间的的一次检验。

LVIS 2021 挑战:

  • 长尾分布
  • 高质量mask和boundary预测

在本次比赛中,FuXi-Fresher团队采用了经典的二阶段实例分割网络HTC,同时backbone部分也采用了更强的Swin Transformer。受CBNetv2算法的启发,团队还通过复合连接两个相同的Swin Transformer网络来进一步提高算法性能。在该Strong baseline基础上,进行了两方面的改进以分别应对长尾分布问题和更高质量mask预测问题。

内容中包含的图片若涉及版权问题,请及时与我们联系删除