A Dataset for Pharmacovigilance in German, French, and Japanese: Annotating Adverse Drug Reactions across Languages

2024年03月27日
  • 简介
    用户生成的数据来源在揭示不良药物反应方面变得越来越重要,越来越多的讨论出现在数字世界中。然而,现有的临床语料库主要围绕英文科学文章展开。本文提出了一个多语言语料库,包括德语、法语和日语的患者论坛、社交媒体和临床报告等不同来源的有关不良药物反应的文本。我们的语料库包含覆盖12个实体类型、4个属性类型和13个关系类型的注释。它有助于开发用于医疗保健的真实世界的多语言语言模型。我们提供了统计数据以突出与语料库相关的某些挑战,并进行了初步实验,结果为提取实体和实体之间的关系提供了强有力的基线,包括跨语言的关系。
  • 图表
  • 解决问题
    论文旨在解决从多语言数据中提取药物不良反应信息的问题。这是一个新问题,因为现有的临床语料库主要集中在英文科学文章上,缺乏多语言数据源。
  • 关键思路
    论文提出了一个从多语言数据源中提取药物不良反应信息的方法,包括从患者论坛、社交媒体和临床报告中收集数据,并使用多语言实体和关系标注。
  • 其它亮点
    论文提供了一个多语言药物不良反应语料库,并进行了初步实验,得到了在多语言环境下提取实体和实体之间关系的强基线结果。该语料库为开发适用于医疗保健的真实世界多语言语言模型做出了贡献。
  • 相关研究
    在该领域的相关研究包括:1.使用深度学习方法从社交媒体中提取药物不良反应信息;2.使用远程监督方法从电子病历中提取药物不良反应信息。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论