ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略，与PLM结合效率不减

论文标题：

Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents

论文地址：

文本语义匹配是一项被广泛应用到各种场景的基本任务，如社区问答、信息检索和推荐等。最新的匹配模型，例如 BERT，通过统一处理每个词来直接进行文本的比较。然而，查询语句通常需要在不同的粒度上与内容进行匹配。具体的，关键词代表了应该严格匹配的事实信息，如动作、实体、事件。而意图词则表达了抽象的概念和想法，通常有多种表达方式。在这项工作中，我们提出了一个简单而有效的文本语义匹配的训练策略，通过分治的方式将关键词从意图中分离出来。我们的方法可以很容易的与预训练语言模型（PLM）相结合，不影响其推理效率。在三个基准集上，实现了在广泛 PLM 模型上的稳定效果提升。

DC-Match 匹配，可以很容易的与文本匹配分类模型相结合。它包括三个训练目标，即: 全局匹配模型的分类损失；基于远程监督的分类损失，用于区分出关键词和意图；遵循分治思想的特殊训练目标，使用 KL-divergence 来确保全局匹配分布 (原始问题) 与分离开关键词和意图 (子问题) 后所得出的组合分布是相似的。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略，与PLM结合效率不减

评论列表

评论