- 简介临床文本信息丰富,包含了治疗、药物和解剖等众多临床术语。多个术语可以指向同一核心概念,这些概念可以被称为临床实体。为了存储数百万个临床实体的定义、关系和其他相关信息,开发和维护了像统一医学语言系统(UMLS)这样的本体。这些本体通过生物医学实体链接对临床文本进行标准化,从而规范不同表面形式的临床术语。随着基于Transformer的语言模型的引入,生物医学实体链接取得了显著进展。在本文中,我们专注于通过与实体相关的同义词对进行学习。与现有方法相比,我们的方法显著减少了训练数据和资源消耗。此外,我们提出了一套基于上下文和无上下文的重新排序技术,用于执行实体消歧。总体而言,在不进行任何基于领域的训练的情况下,我们在Medmentions数据集上实现了与最先进的零样本和远程监督实体链接技术类似的性能,该数据集是UMLS上最大的注释数据集。最后,我们表明仅使用检索性能可能不足作为评估指标,并引入了一篇文章级定量和定性分析来揭示实体链接方法的性能进一步见解。
- 图表
- 解决问题本论文的问题是如何通过使用同义词对来学习临床实体链接,以及如何通过上下文相关和上下文无关的重新排序技术进行实体消歧。该方法旨在减少训练数据和资源消耗。
- 关键思路本论文的关键思路是使用同义词对来学习临床实体链接,并通过上下文相关和上下文无关的重新排序技术进行实体消歧。这种方法可以减少训练数据和资源消耗,并且在不需要基于领域的训练的情况下,在Medmentions数据集上实现了与现有技术相似的性能。
- 其它亮点本论文的亮点包括使用同义词对来学习临床实体链接,以及通过上下文相关和上下文无关的重新排序技术进行实体消歧。实验使用了Medmentions数据集,并且在不需要基于领域的训练的情况下实现了与现有技术相似的性能。此外,论文还提出了一种文章级定量和定性分析方法,以揭示实体链接方法性能的更多见解。
- 最近在这个领域中,也有一些相关的研究。例如,标题为“Zero-Shot Entity Linking with Dense Entity Retrieval”的论文提出了一种零样本实体链接技术。还有一篇名为“Distantly Supervised Biomedical Entity Linking with Implicit Structure Learning”的论文提出了一种基于远程监督的生物医学实体链接技术。
沙发等你来抢
去评论
评论
沙发等你来抢