The text2term tool to map free-text descriptions of biomedical terms to ontologies

2024年07月02日
  • 简介
    目前,需要可扩展的工具来帮助研究人员在回顾性和预测性标准化离散实体类型方面进行元数据的标准化,例如疾病名称、细胞类型或化学品。当元数据不够结构化或准确时,相关数据很难找到,并且由于需要前期的筛选工作,通常需要通过回顾性标准化和清理元数据,才能使数据可用于重复利用、分析或与其他数据集集成。为了促进元数据标准化的任务,我们开发了一个名为text2term的开源工具,它将生物医学实体的自由文本描述映射到本体论中的受控术语,以支持批量或逐一标准化元数据的任务,例如支持生物医学实体在表单中的自动填写。该工具高度可配置,可以以多种方式使用,以满足不同用户和专业水平的需求。它可以像任何Python包一样以编程方式使用,并可通过命令行界面或我们托管的基于图形用户界面的Web应用程序(https://text2term.hms.harvard.edu)使用,也可以通过使用Docker部署我们的交互式应用程序的本地实例来使用。
  • 图表
  • 解决问题
    本文旨在开发一个名为text2term的开源工具,帮助研究人员将生物医学数据中的自由文本描述映射到本体论中的受控术语,以便更好地标准化元数据。
  • 关键思路
    text2term工具的关键思路是使用机器学习模型将自由文本描述映射到本体论中的受控术语。该工具可通过Python包、命令行界面、Web应用程序或Docker部署进行使用。
  • 其它亮点
    text2term工具高度可配置,适用于不同的用户和专业水平。该工具可用于自动完成生物医学实体表单中的实体,从而标准化元数据。此外,该工具可通过Web应用程序进行交互式使用,并且已在PyPI上提供。
  • 相关研究
    最近的相关研究包括BioPortal、NCBO Annotator和MetaMap等工具,这些工具也可以将自由文本描述映射到受控术语。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论