【论文标题】CrossNER: Evaluating Cross-Domain Named Entity Recognition 【作者团队】Zihan Liu, Yan Xu, Tiezheng Yu, Wenliang Dai, Ziwei Ji, Samuel Cahyawijaya, Andrea Madotto, Pascale Fung 【论文链接】https://arxiv.org/pdf/2012.04373.pdf 【代码链接】https://github.com/zliucr/CrossNER 【推荐理由】本文来自香港科技大学人工智能研究中心,已被AAAI-2021接收。文章构建了一个跨域的全标记NER数据集(CrossNER)用于评估跨领域NER任务,发布了一组现有的强NER模型的基准结果,同时提出了优于当前最先进的模型的竞争性基线。 跨域命名实体识别模型能够解决目标域内命名实体样本的稀缺性问题。然而,当前大多数现有的NER基准测试缺乏领域专用的实体类型,或者不关注某个领域,从而导致跨领域评估的效率较低。为了解决这些障碍,文章引入了一个跨域NER数据集(CrossNER),它是一个全标记的NER数据集合,跨越五个不同的域,具有针对不同域的专门实体类别。然后,文章进行了全面的实验来探讨利用不同层次的领域语料库和预训练策略对跨领域任务进行领域自适应预训练的有效性。 结果表明,在领域自适应预训练中,关注包含领域专门化实体的分数语料库,并采用更具挑战性的预训练策略,有利于NER域的自适应,该方法始终优于现有的跨域NER基线。

内容中包含的图片若涉及版权问题,请及时与我们联系删除