蛋白激酶是细胞信号传导途径中的关键调节组件,其异常激活或过表达与多种疾病相关,例如癌症、糖尿病、免疫失调和神经系统疾病等。因此,激酶靶向抑制剂是一类极具价值的治疗药物。然而,由于疾病通路的代偿机制和激酶家族结构相似性带来的脱靶效应,针对单一激酶的抑制剂往往难以持续发挥疗效并带来非预期的毒副作用,而多激酶选择性抑制剂能够在最小化多重药理学风险的同时提供更好的疗效。为了满足更广泛的患者治疗需求,降低激酶脱靶毒副作用风险,研究人员需要对激酶抑制剂的多重药理学效应进行系统评估。目前,激酶组范围的实验活性分析成本高昂,现有的计算工具对未充分研究的“暗”激酶及激酶突变体缺乏预测能力。因此,需要开发具有更广泛应用场景的AI算法,通过充分利用内部或自有实验数据,大规模筛选潜在的多靶点选择性激酶抑制剂。

中国科学院上海药物研究所郑明月课题组建设了一个支持用户定制的激酶多靶点活性筛选AI平台KinomeMETAhttps://kinomemeta.alphama.com.cn/1)。该平台使用结合图神经网络的元学习技术,极大地拓展了可准确预测的激酶范围,并为用户提供了使用私有数据定制模型的实用功能。研究结果516日在线发表于Nucleic Acids Research,题为“KinomeMETA: a web platform for kinome-wide polypharmacology profiling with meta-learning”。

图1. KinomeMETA平台概览。(A)数据划分策略。(B)模块输入格式。其中预测模块输入分子结构。定制模块输入分子结构及其在目标激酶上的活性标签。(C)KinomeMETA的元训练过程。(D)KinomeMETA的微调过程。已建立的激酶模型通过微调元学习器得到。用户提交的私有数据根据研究目的用于微调元学习器或已建立的激酶模型。(E)预测模块的结果展示,包括相似结构的激酶抑制剂及其主要靶点,激酶选择性评估、系统发生树和分子性质。
平台特性

1.1 高精度、大范围的激酶抑制预测功能

KinomeMETA的预测(Prediction)模块可以预测用户提交分子对661个野生和突变激酶的抑制活性概率。与研究团队先前的小分子激酶多重药理学预测平台KinomeXhttps://kinome.simm.ac.cn/en/[1]相比,KinomeMETA的训练数据和激酶预测范围得到了显著扩展——生物活性数据点增加了3.6倍,化合物增加了5倍,激酶增加了1.69倍。激酶可预测范围的增加得益于元学习算法,该算法使得KinomeMETA能够高效地利用稀疏活性数据对研究较少的激酶和突变激酶提供准确预测

研究人员采用了两种基准方法KinomeMETA平台进行了性能对比:一种KinomeX平台使用的多任务深度神经网络(MTDNN),另一种是当前的最先进方法,多任务图神经网络(MTGNN[2]对比模型遵循与KinomeMETA似的构建和训练流程。所有模型在519个测试激酶任务上进行了独立测试。结果表明,KinomeMETA的分类能力始终显著优于MTDNNMTGNN2A

图2.
KinomeMETA的性能分析。
(A)所有测试任务的MTDNN、MTGNN和KinomeMETA的平均预测性能。MCC代表马修斯相关系数,BACC代表平衡准确率,auROC代表受试者工作特征曲线下面积。统计分析采用单侧Wilcoxon符号秩检验进行。(*)0.01 < p ≤ 0.05;(**)0.001 < p ≤ 0.01;(***)p ≤ 0.001。(B)在所有测试任务的数据添加实验中,KinomeMETA、MTDNN 和 MTGNN 的性能比较,以MCC为指标。(C)在EGFR激酶任务的数据添加实验中,KinomeMETA、MTDNN和MTGNN的性能比较,以MCC为指标。
1.2 基于快速微调的激酶模型定制功能

用户定制(Customization)模块是KinomeMETA平台的全新功能。该功能允许用户使用少量私有激酶活性数据在线建立定制模型(1BD)。这使得KinomeMETA摆脱了传统模型中仅能依靠公开实验数据构建的限制,帮助用户充分结合计算模型与已有实验数据,提升针对特定激酶的研究效能。

在低数据可用性的场景下,传统计算方法通常难以获得对新激酶的泛化能力。与之相比,基于元学习的KinomeMETA通过在多个代表性激酶任务上训练,得到一个具有最优初始化参数的元学习器。元学习器具备对不同激酶的快速泛化能力,仅使用少量数据对其微调即可迅速获得对相应激酶的预测性能[3]

2B显示的数据添加实验对比了不同模型在使用不同数量训练数据时的预测性能差异,展示了KinomeMETA利用有限数据快速微调的强大特性具体而言,研究人员选择了至少20个活性数据点的测试激酶任务在每个任务中固定20%测试样本并分别使用不同数量的剩余活性数据微调模型。,无论所用微调数据的大小,KinomeMETA的表现始终优于基准模型。EGFR任务为例2C),即使只利用20个活性数据点,KinomeMETA也取得了可观的性能(MCC = 0.68),接近使用全量数据时的性能(MCC = 0.72)。相比之下,基准模型性能提升缓慢且最终性能较低。

1.3 激酶选择性和分子性质分析

除了激酶抑制预测活性外,KinomeMETA平台提供了三个维度的结果分析:激酶选择性、分子性质分析和相似结构抑制剂鉴别(1E)。

KinomeMETA平台使用标准分数[4]和基尼系数[5]评估提交分子的整体激酶选择性,使用比值比odds ratioOR)衡量激酶亚家族的选择性[6]

分子性质分析用于考察提交化合物的类药性,包括提交小分子的预测物理化学性质药物化学规则评估。我们开发了一种判别器,用于判断提交化合物是否属于激酶抑制剂

此外,结果界面还展示数据库中与提交分子结构相似度排名前10激酶抑制剂及其主要靶点信息,以帮助研究人员探索提交化合物的潜在靶点。

案例研究

PKMYT1是一个具有高度选择性的激酶治疗靶点,在已有的实验筛选中命中率很低(4.17% [7]1.25% [8])。在先前的研究中,我们利用KinomeMETA发现9个新的抑制PKMYT1的活性化合物[3]

为了说明KinomeMETA定制功能的快速微调特性和实用性,这些化合物被用于微调默认模型Default PKMYT1-KinomeMETA以得到新的定制模型Customized PKMYT1-KinomeMETA)。然后,我们基于KinomeMETA和分子对接两种手段分别实验室内部的4,700小分子化合物进行PKMYT1的虚拟筛选,并通过实验测定所有化合物在25μM浓度PKMYT1的抑制率,以检验两种方法对新活性分子的发现能力

3A展示了定制模型预测概率与实验抑制率之间的关系。其中,预测概率超过0.9的化合物显示出更高的抑制率。相比之下,对接模型没能显示出“对接得分更好则命中率更高”的趋势(3B)。进一步的命中率分析显示,KinomeMETA模型(包括默认和定制)对排名前20至前100的不同范围化合物的命中率均明显优于对接模型3C)。此外,定制模型始终优于默认模型,突显了KinomeMETA使用有限新数据快速增强预测性能高效能力。

基于UMAP对分子进行化学空间可视化分析表明(3D),通过定制模型新发现的活性化合物数量较多且分布广泛。相比之下,分子对接只发现了3性化合物,其中一个与已知活性化合物结构相似,另一个也可被定制模型预测得到

图3.
对内部化合物库PKMYT1抑制剂虚拟筛选的KinomeMETA和分子对接结果评估。(A)KinomeMETA的不同预测概率区间内化合物对PKMYT1在25μM浓度下的抑制率。虚线表示每个区间内的分子数量。(B)分子对接得分的不同打分区间内化合物对PKMYT1在25μM浓度下的抑制率。虚线表示每个区间内的分子数量。(C)不同方法预测排名前20~前100的化合物命中率,包括定制PKMYT1-KinomeMETA、默认PKMYT1-KinomeMETA和分子对接模型。(D)所有化合物、训练化合物、微调化合物、分子对接鉴别的新活性化合物和定制PKMYT1-KinomeMETA鉴别的新活性化合物的统一流形逼近和投影分析(UMAP)。同时具有红色和紫色的点表示由KinomeMETA和分子对接同时鉴别出的活性化合物。

3 总结

KinomeMETA是一个全面升级的激酶多靶点小分子抑制剂预测平台相比于先前的KinomeX平台,KinomeMETA拥有更广泛的激酶预测范围和更高的预测精度本平台的一个重要突破是引入了元学习驱动的定制模块。该模块使研究人员能够使用少量私有数据在线创建新激酶模型或改进现有激酶模型,通过迭代的干/湿实验循环,有效应对药物发现中低数据场景KinomeMETA平台成为激酶研究人员的强力工具,显著加速新型激酶抑制剂的发现。

德州学院李召军博士、中国科学院上海药物研究所研究生曲宁和上海科技大学研究生周敬怡为论文的共同第一作者。中国科学院上海药物研究所药物发现与设计中心(DDDC李叙潼副研究员、郑明月研究员与张素林副研究员为论文通讯作者。本研究得到了国家自然科学基金、国家重点研发专项、中国博士后科学基金、中国科学院青年创新促进会、上海药物研究所与上海中医药大学中医药创新团队联合研究项目、以及上海市科技重大专项资助。

参考文献

[1] Li Z, Li X, Liu X, et al. KinomeX: a web application for predicting kinome-wide polypharmacology effect of small molecules[J]. Bioinformatics, 2019, 35(24): 5354-5356.[2] Bao L, Wang Z, Wu Z, et al. Kinome-wide polypharmacology profiling of small molecules by multi-task graph isomorphism network approach[J]. Acta Pharmaceutica Sinica B, 2023, 13(1): 54-67.[3] Ren Q, Qu N, Sun J, et al. KinomeMETA: meta-learning enhanced kinome-wide polypharmacology profiling[J]. Briefings in Bioinformatics, 2023, 25(1): bbad461.[4] Karaman M W, Herrgard S, Treiber D K, et al. A quantitative analysis of kinase inhibitor selectivity[J]. Nature Biotechnology, 2008, 26(1): 127-132.[5] Graczyk P P. Gini Coefficient:  A New Way To Express Selectivity of Kinase Inhibitors against a Family of Kinases[J]. Journal of Medicinal Chemistry, 2007, 50(23): 5773-5779.[6] Bland J M, Altman D G. The odds ratio[J]. BMJ, 2000, 320(7247): 1468.[7] Davis M I, Hunt J P, Herrgard S, et al. Comprehensive analysis of kinase inhibitor selectivity[J]. Nature Biotechnology, 2011, 29(11): 1046-1051.[8] Platzer C, Najjar A, Rohe A, et al. Identification of PKMYT1 inhibitors by screening the GSK published protein kinase inhibitor set I and II[J]. Bioorganic & Medicinal Chemistry, 2018, 26(14): 4014-4024.

原文链接

Li. et al., KinomeMETA: a web platform for kinome-wide polypharmacology profiling with meta-learning, Nucleic Acids Research (2024), https://doi.org/10.1093/nar/gkae380.

内容中包含的图片若涉及版权问题,请及时与我们联系删除