目前,命名实体识别主要涉及三种类型,包括连续实体识别、嵌套实体识别和不连续实体识别。以往大部分研究工作是单独对它们进行研究的。最近,研究者们开始进行联合命名实体识别研究,即用一个统一的模型同时处理上述三种情况。目前比较先进的方法主要包括基于序列标注的模型,基于超图的模型,基于文本跨度的模型,以及基于序列到序列的模型。
在本篇工作中,我们提出了一种新的方法,将联合命名实体识别任务看成词-词关系分类问题。该方法利用词和词的邻居关系和实体词的头尾关系进行命名实体识别。基于该思想,我们构建了一个神经网络模型,利用BERT、卷积、biaffine等深度学习模块进行词和词的关系预测
我们在14个中文和英文命名实体识别数据集上进行了大量实验。结果发现,我们方法的性能超越了目前绝大多数基线方法的性能。我们将在github上公开本项工作的代码:https://github.com/ljynlp/W2NER.git
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢