介绍来自阿斯利康的AI工程总监Eliseo Papa带领的研究团队发表在bioRxiv的一篇文章“Biological Insights Knowledge Graph: an integrated knowledge graph to support drug development”。文中提出了一个新的知识图谱——Biological Insights Knowledge Graph (BIKG),它充分结合了来自公开数据源和阿斯利康企业内部数据源的相关数据,能够为一系列任务(从新靶点的识别,到现有药物的再利用)提供洞察力。本文描述了实现BIKG图的主要设计选择,并讨论了其从图的构建到开发的生命周期的各个方面。

论文链接:https://www.biorxiv.org/content/10.1101/2021.10.28.466262v1

BIKG项目概览(数据类型、图构建、示例用例)

BIKG项目的重点在于构建一个集成内部和外部相关数据的生命科学领域的知识图谱,暂时仅供阿斯利康内部使用。它可以应用于机器学习算法并获得新的洞察力。该方法在几个示例用例中已经证明了它的价值,例如CRISPR推荐和靶点识别。另外,这样的知识图谱还拥有组织层面上的次级效益:

(1) 缩短数据准备工作的时间:把构建图时调整数据格式和特征解析等常见的任务考虑在内,这给科学家留下更充足的时间进行实际研究。

(2) 提高质量:专用的API和模板,可以支持按需要快速添加用户数据以及获得来自涉众的快速反馈。

(3) 降低成本:核心图以及通用的任务解决方案可以在跨用例和跨组织单位之间重用。

在未来的工作中,作者将专注于研究BIKG图去适应新的用例,并提高其对新型机器学习技术(如图神经网络、强化学习和可解释人工智能)的适用性。

内容中包含的图片若涉及版权问题,请及时与我们联系删除