本文主要解决的是事件抽取任务中常见的角色重叠问题,即在多事件句中,同一个元素实体扮演了两个或多个角色。首次在事件抽取任务中引入命名实体识别领域基于外部词典的SOTA模型Flat-lattice transformer,有利于模型获取语料之外的先验信息,提高触发词与事件元素的识别效果;通过对数据集的统计发现,不同的角色在事件中出现频率差别较大,出现频率高的角色“辨识度”高,更能代表该类事件;在同一类型事件中,同现频率高的角色之间关系更紧密,并依此作为各个角色分类器的损失权重。在公开的中文事件抽取数据集上取得较好性能。
CCKS2021| 基于角色分离的中文事件抽取研究(张旭,朱艳辉,曾志高,欧阳康,孔令巍)
沙发等你来抢
去评论
评论
沙发等你来抢