GINet: Graph Interaction Network for Scene Parsing

论文链接:http://xxx.itp.ac.cn/abs/2009.06160

表现SOTA!性能优于ACNet、DMNet和CCNet等网络,作者单位:百度, 北京邮电大学等

最近,使用超出局部卷积的图像区域进行上下文推理已显示出场景解析的巨大潜力。在这项工作中,我们探索如何通过提出图交互unit(GI unit)和语义上下文损失(SC-loss)来整合语言知识以在图像区域上促进上下文推理。 GI unit能够通过高级语义增强卷积网络的特征表示,并自适应地学习每个样本的语义一致性。具体而言,首先将基于数据集的语言知识合并到GI unit中,以促进视觉图上的上下文推理,然后将视觉图的演变表示形式映射到每个局部表示形式,以增强区分场景解析的能力。通过SC损失进一步改进了GI unit,以增强基于示例的语义图的语义表示。我们进行了完整的消融研究,以证明我们方法中每个组件的有效性。尤其是,提出的GINet在包括Pascal-Context和COCO Stuff在内的流行基准上均优于最新方法。

内容中包含的图片若涉及版权问题,请及时与我们联系删除