【论文标题】Biomedical Named Entity Recognition at Scale
【作者团队】Veysel Kocaman, David Talby
【发表时间】2020/11/12
【论文链接】https://arxiv.org/pdf/2011.06315.pdf
【推荐理由】本文基于Apache Spark复现了BiLSTM-CNN-Char深度学习架构,并提出一种单一的可训练的NER模型,该模型无需基于BERT这样的复杂上下文嵌入。同时在7个公共生物医学数据集上均取得了SOTA结果。
命名实体识别是一项应用广泛的自然语言处理任务,是问答、主题建模、信息检索等领域的基础任务。在医疗领域,NER扮演着重要的角色,它从临床笔记和报告中提取有意义的块,然后将这些块反馈给下游任务,如断言状态检测、实体解析、关系提取和去识别。文章主要贡献有三点:1、提供了第一个生产级可伸缩的NER模型实现。2、提供一个最先进的NER模型,超过Stanza和SciSpaCy报告的生物医学NER基准。3、解释了Spark NLP中的NER模型实现,它是唯一可以在Spark集群中扩展的NLP库,同时支持流行的编程语言(Python、Java等)。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢