Orion：基于语言模型的开放规则挖掘系统

在这篇文章中，我们首先重新审视了基于Knowledge Base(KB-based)和基于Language Model(LM-based)的规则挖掘方法。我们发现，传统的基于Knowledge Base的规则挖掘方法的缺陷在于它们仅能够根据Knowledge Base中的知识进行总结。这就导致了KB-based的方法无法推广到更加开放、复杂的现实世界当中。而最近提出的LM-based方法(COMET)，其虽然能够通过文本生成来增强规则的多样性，但我们发现其本质上是“从人工标注的规则中学习规则”，而非KB-based的“从数据中总结规则”。这种学习方法将导致其生成的规则受限于训练集的规则当中。

因此，我们提出了Open Rule Induction。我们希望通过利用LM中的知识来归纳总结开放规则(open rule)。基于此，我们提出了Orion系统来自动从LM挖掘开放规则。我们的Orion并不需要任何标注数据或规则进行训练。在实验部分，我们进行了大量实验来验证引入的开放规则的质量和数量。与此同时，我们发现Orion生成的rule能够在下游的关系提取任务中得到很好的应用。

文章链接：https://arxiv.org/abs/2110.13577

代码仓库：https://github.com/chenxran/Orion

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Orion：基于语言模型的开放规则挖掘系统

评论列表

评论