Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition

简介

本文探讨了嵌套命名实体识别（NNER）中存在的实体重叠问题。与扁平命名实体识别（FNER）相比，NNER语料库中的注释资源较为稀缺。数据增强是解决注释不足的有效方法。然而，目前对于NNER的数据增强方法探索不足。由于NNER中存在嵌套实体，现有的数据增强方法不能直接应用于NNER任务。因此，本文着重研究NNER的数据增强，并采用更具表现力的结构，即组合嵌套标签分类（CNLC），通过嵌套单词和嵌套标签组合来建模嵌套实体。使用组合嵌套学习（CNL）对数据集进行增强。此外，本文提出置信度过滤机制（CFM），以更高效地选择生成的数据。实验结果表明，这种方法改善了ACE2004和ACE2005数据集的性能，并缓解了样本不平衡问题。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决嵌套命名实体识别（NNER）中数据不足的问题，提出了一种基于组合嵌套标签分类（CNLC）和嵌套学习（CNL）的数据增强方法。
关键思路

论文提出了一种基于CNLC和CNL的数据增强方法，用于解决NNER中数据不足的问题。该方法可以更好地处理嵌套实体，并提出了置信度过滤机制（CFM）来更有效地选择生成的数据。
其它亮点

论文使用了ACE2004和ACE2005数据集进行实验，结果表明该方法可以提高模型的性能。论文提出的CNLC和CNL方法可以更好地处理嵌套实体，而CFM机制可以更有效地选择生成的数据。论文还指出，现有的数据增强方法无法直接应用于NNER任务。
相关研究

最近的相关研究包括：《Neural Architectures for Nested NER through Linearization》、《A Survey of Named Entity Recognition and Classification》等。

Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition

提问交流

提问交流