DRUGONE

大环类药物在调控蛋白–蛋白相互作用等困难靶点方面具有独特优势,但其细胞膜通透性通常较差且难以预测,严重制约了口服成药性评估。实验测定成本高昂,而基于三维构象的计算方法又受到构象空间庞大的限制。研究人员提出了一种基于知识蒸馏的深度学习框架 Multi_DDPP,仅依赖二维分子结构即可实现高精度的大环药物通透性预测。该方法通过从多细胞系、低保真但大规模的预训练数据中蒸馏隐含知识,并结合多种分子表征形式,在准确性、泛化能力和可解释性方面显著优于现有方法,为大环药物的早期筛选提供了一种高效、可扩展的解决方案。

随着可合成化学空间的爆炸式增长,大规模实验筛选已不再现实,计算方法成为药物发现中不可或缺的过滤手段。相较于小分子,大环化合物具有更高的构象柔性、复杂的立体化学特征以及超越传统“药物相似性规则”的理化性质,使得其通透性预测尤为困难。


尽管近年来深度学习在 ADME 性质预测中表现突出,但在大环药物领域仍面临多重挑战,包括实验数据稀缺、不同实验体系之间的标注不一致,以及标签噪声对模型稳定性的影响。现有方法往往基于单一实验体系训练,难以充分利用不同实验条件下蕴含的共性信息。因此,如何在充分利用异构数据的同时,提高模型在特定高质量任务上的预测能力,成为关键问题。


方法

研究人员提出的 Multi_DDPP 框架采用“教师–学生”式的知识蒸馏策略:首先在包含多种细胞系通透性数据的大规模数据集上进行预训练,以学习通透性相关的通用分子特征;随后将这些隐含知识迁移到以高质量大环药物数据为核心的特定任务中。模型融合了分子描述符、指纹特征和分子图结构等多种表示,并引入任务特异性的“摆动区间”策略以降低实验噪声对标签的干扰,从而在保证数据利用率的同时提升预测可靠性。

图 1|Multi_DDPP 模型整体框架。


结果

多源数据知识蒸馏显著提升预测性能

在不使用知识蒸馏的情况下,基线模型已优于多种传统机器学习和图神经网络方法。引入知识蒸馏后,Multi_DDPP 在准确率、AUC 和相关性指标上均取得进一步提升,显示出从大规模异构数据中提取隐含信息的明显优势。

图 2| Multi_DDPP 与基线模型的高保真数据集及预测性能评估。


在不同噪声水平下保持稳健表现

研究人员通过调节标签摆动区间构建了不同噪声水平的数据集。结果显示,无论在高噪声还是低噪声条件下,Multi_DDPP 始终保持最优或近乎最优的预测性能,表明该方法对实验不确定性具有良好的鲁棒性。


对不同环尺寸大环分子的适用性分析

按环尺寸对大环分子进行分组后发现,模型在中小尺寸大环中表现尤为出色,而在超大环体系中预测性能有所下降。这一趋势与大环尺寸增大所带来的构象复杂性增加相一致。

图 3| 大规模预训练数据集对模型性能影响的评估。


节点特征分析揭示通透性关键结构因素

通过节点遮蔽分析,研究人员识别出对通透性预测贡献最大的原子特征,包括氢键供体、孤对电子以及是否位于大环骨架中等因素。结果表明,侧链暴露的极性基团往往显著降低通透性,而嵌入环内、被疏水结构屏蔽的极性基团更有利于膜穿透。

图 4| 节点特征重要性分析。


图 5| 可渗透(正样本)与不可渗透(负样本)大环分子中氢键供体(HBD)暴露程度分析。


回归模型与外部数据集验证

除分类任务外,研究人员还构建了通透性回归模型,并引入实验条件相关的生理参数信息。在训练集与测试集中均取得较高拟合度。同时,在独立外部数据集上的验证结果表明,该模型具有良好的泛化能力。

图 6| 回归模型性能评估及大环化合物库的分布特征。


讨论

该研究提出的 Multi_DDPP 框架展示了知识蒸馏在大环药物通透性预测中的独特价值。通过从相关但低保真的大规模数据中迁移信息,研究人员在数据有限的高质量任务中显著提升了模型性能。同时,引入摆动区间策略有效缓解了实验噪声问题,使模型更贴近真实应用场景。


尽管该方法目前主要基于二维结构信息,尚未显式引入大环构象的三维动态特征,但其结果已表明二维表示在早期筛选阶段具有重要实用价值。未来,将多模态结构信息与细胞环境建模相结合,有望进一步提升大环药物通透性预测的准确性与解释力。

整理 | DrugOne团队


参考资料


Enhancing the Predictive Power of Macrocyclic Drug Permeability by Knowledge Distillation from Analogous Pretraining Data. Yu Zhang and Olli T. Pentikäinen.  Journal of Medicinal Chemistry.

DOI: 10.1021/acs.jmedchem.5c02620

内容为【DrugOne】公众号原创转载请注明来源

内容中包含的图片若涉及版权问题,请及时与我们联系删除