常识知识(Commonsense Knowledge)对于人工智能系统理解自然语言至关重要。现有的常识知识获取方法通常依赖于人工标注(例如ATOMIC)或文本生成模型(例如COMET)。人工标注可以提供高质量的常识知识,但是其高昂的费用导致获取的知识规模相对较小且覆盖率较低。另一方面,语言生成模型具有自动生成更多知识的潜力。然而,机器学习模型通常overfit训练数据而无法生成高质量的新知识,这也会导致无法覆盖全面的常识知识。为了解决先前方法的局限性,本文提出了另一种常识知识获取框架DISCOS(从DIScourse到COmmonSense),该框架自动从更便宜的语言知识资源中挖掘昂贵的复杂常识知识。实验表明,我们可以成功地将discourse knowledge从大型discourse knowledge graph, ASER 中转换为ATOMIC中定义的inferentialif-then常识知识,而无需进行任何人工标注。进一步的研究表明,DISCOS在生成新颖和多样的常识知识上表现远优于已有的supervised learning方法。通过将ATOMIC中的知识populate到ASER的核心部分ASER-core中,我们总共可以获得3.4 Million ATOMIC形式的inferential常识知识。

感兴趣的可以戳原文或论文链接。

内容中包含的图片若涉及版权问题,请及时与我们联系删除