【论文标题】Unsupervised Natural Language Inference via Decoupled Multimodal Contrastive Learning 【作者团队】Wanyun Cui, Guangyu Zheng, Wei Wangz 【发表时间】2020.10.16 【论文链接】https://arxiv.org/abs/2010.08200v1 【推荐理由】论文收录于EMNLP-2020会议,提出多模态对齐对比解耦学习,它学习在只使用文本作为输入的情况下表示视觉知识。在实验中,论文提出的方法稳步地大大超过其他方法。

研究人员提出通过任务无关的多模态预训练来解决自然语言推理问题,不需要从推理标签中进行任何监督。虽然最近的多模态自监督学习研究也表示语言和视觉语境,但它们针对不同模态的编码器是耦合的。因此,它们在单独编码纯文本时无法纳入视觉信息。在本文中,研究人员提出多模态对齐对比解耦学习(MACD)网络。MACD迫使解耦文本编码器通过对比学习来表示视觉信息。因此,即使对于纯文本推理,它也嵌入了视觉知识。在纯文本推理数据集上进行了综合实验,在STS-B上无监督的MACD甚至优于完全监督的BiLSTM和BiLSTM+ELMO。

图:不同多模态自监督学习方法比较

内容中包含的图片若涉及版权问题,请及时与我们联系删除