【论文标题】Validating Label Consistency in NER Data Annotation 【作者团队】Qingkai Zeng, Mengxia Yu, Wenhao Yu, Tianwen Jiang, Tim Weninger, Meng Jiang 【发表时间】2021/01/21 【论文链接】https://arxiv.org/pdf/2101.08698.pdf 【推荐理由】提出了一个实证方法来探讨标签一致性与NER模型性能之间的关系。它可以用于验证多组NER数据注释中的标签一致性(或捕获不一致)。 数据标注在确保指定实体识别(NER)项目得到正确信息的训练方面起着至关重要的作用。由于标注的复杂性,生成最准确的标签是一项挑战。数据标注的多个子集(如训练集和测试集,或多个训练子集)之间的标签不一致是标签错误的一个指标。在本研究中,我们提出了一个实证方法来探讨标签一致性与NER模型性能之间的关系。它可以用于验证多组NER数据注释中的标签一致性(或捕获不一致)。在实验中,我们的方法识别了SCIERC和CoNLL03数据集测试数据的标签不一致(标签错误分别为26.7%和5.4%)。它验证了两个数据集的修正版本的一致性。

内容中包含的图片若涉及版权问题,请及时与我们联系删除