- 简介本文探讨了嵌套命名实体识别(NNER)中存在的实体重叠问题。与扁平命名实体识别(FNER)相比,NNER语料库中的注释资源较为稀缺。数据增强是解决注释不足的有效方法。然而,目前对于NNER的数据增强方法探索不足。由于NNER中存在嵌套实体,现有的数据增强方法不能直接应用于NNER任务。因此,本文着重研究NNER的数据增强,并采用更具表现力的结构,即组合嵌套标签分类(CNLC),通过嵌套单词和嵌套标签组合来建模嵌套实体。使用组合嵌套学习(CNL)对数据集进行增强。此外,本文提出置信度过滤机制(CFM),以更高效地选择生成的数据。实验结果表明,这种方法改善了ACE2004和ACE2005数据集的性能,并缓解了样本不平衡问题。
-
- 图表
- 解决问题论文旨在解决嵌套命名实体识别(NNER)中数据不足的问题,提出了一种基于组合嵌套标签分类(CNLC)和嵌套学习(CNL)的数据增强方法。
- 关键思路论文提出了一种基于CNLC和CNL的数据增强方法,用于解决NNER中数据不足的问题。该方法可以更好地处理嵌套实体,并提出了置信度过滤机制(CFM)来更有效地选择生成的数据。
- 其它亮点论文使用了ACE2004和ACE2005数据集进行实验,结果表明该方法可以提高模型的性能。论文提出的CNLC和CNL方法可以更好地处理嵌套实体,而CFM机制可以更有效地选择生成的数据。论文还指出,现有的数据增强方法无法直接应用于NNER任务。
- 最近的相关研究包括:《Neural Architectures for Nested NER through Linearization》、《A Survey of Named Entity Recognition and Classification》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流