论文题目:Robust Triple Extraction with Cascade Bidirectional Capsule Network

本文作者:张宁豫(浙江大学)、邓淑敏(浙江大学)、叶宏彬(浙江大学)、张伟(阿里巴巴),陈华钧(浙江大学)

接收期刊:Expert Systems With Applications

 

 

我们在分析端到端实体关系抽取错误案例的时候发现,大多数错误可以被归类为以下两种类型。首先,我们发现大多数被被误判的关系是由于上下文存在较大的歧义性。例如,对于关系cities_of_residence和 countries_of_residence,由于这两类关系的上下文非常类似,仅仅是头尾实体类型有略微的区别(city和country)。这些语义相似的上下文容易引起模型的误判,进而抽取出错误的三元组。其次,我们发现模型会犯一些低级错误,抽取出违反既定schema的三元组知识。例如,has_religion关系的头实体和尾实体必须分别是人和信仰而不能是其他类型的实体。一般来说,实体关系之间存在一定的约束,实体的类型能促进关系的判别,而关系的类型也能约束实体的抽取。

 

论文链接:https://www.sciencedirect.com/science/article/pii/S095741742101174X

内容中包含的图片若涉及版权问题,请及时与我们联系删除