
在这篇文章中,我们首先重新审视了基于Knowledge Base(KB-based)和基于Language Model(LM-based)的规则挖掘方法。我们发现,传统的基于Knowledge Base的规则挖掘方法的缺陷在于它们仅能够根据Knowledge Base中的知识进行总结。这就导致了KB-based的方法无法推广到更加开放、复杂的现实世界当中。而最近提出的LM-based方法(COMET),其虽然能够通过文本生成来增强规则的多样性,但我们发现其本质上是“从人工标注的规则中学习规则”,而非KB-based的“从数据中总结规则”。这种学习方法将导致其生成的规则受限于训练集的规则当中。
因此,我们提出了Open Rule Induction。我们希望通过利用LM中的知识来归纳总结开放规则(open rule)。基于此,我们提出了Orion系统来自动从LM挖掘开放规则。我们的Orion并不需要任何标注数据或规则进行训练。在实验部分,我们进行了大量实验来验证引入的开放规则的质量和数量。与此同时,我们发现Orion生成的rule能够在下游的关系提取任务中得到很好的应用。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢