DRUGONE
蛋白–肽相互作用在信号转导、免疫调控和药物设计中具有核心作用。准确预测蛋白–肽复合物的结合构象与结合亲和力,是理解分子识别机制和推动肽类药物开发的关键。研究人员提出了一种基于相互作用驱动的图学习框架——GraphPep,该框架能够从蛋白–肽复合物的三维结构中自动提取相互作用特征,并生成定量评分。GraphPep 通过构建相互作用图并利用层次图神经网络建模复合物界面的几何与能量特征。在多个独立基准数据集上,GraphPep 在结合能预测与构象评分任务中均显著优于现有方法,并展示出良好的可解释性与泛化性能。该框架可识别关键界面残基与能量热点区域,为基于结构的肽药设计提供新思路。

蛋白–肽相互作用(Protein–Peptide Interactions, PPIs)普遍存在于生物系统中,涉及酶调控、信号通路、免疫识别与基因表达控制等关键过程。肽分子因其高亲和力与可修饰性,正成为新一代药物设计的重要方向。然而,预测蛋白–肽复合物的三维结构与结合能仍充满挑战。传统的物理打分函数往往依赖经验参数,难以捕捉复杂的非线性界面特征。
随着深度学习的崛起,图神经网络(Graph Neural Networks, GNNs)已在蛋白–配体结合建模中显示出卓越能力,但肽分子高柔性、多构象、能量不均的特性,使得直接迁移变得困难。为解决这一问题,研究人员开发了 GraphPep 框架,以“相互作用”为核心表示单元,从几何、能量与拓扑层面联合建模蛋白–肽界面,从而提升模型物理一致性与预测精度。
方法
GraphPep 包含三个关键模块:
相互作用图构建模块
基于蛋白–肽复合物结构生成相互作用图。节点表示原子或残基,边表示化学键及跨界面非键相互作用(如氢键、范德华接触)。通过距离与角度阈值定义蛋白与肽的跨界面连接关系,从而得到完整的“蛋白–肽相互作用图”。
特征编码与交互机制
每个节点和边包含原子类型、电荷、氢键供体/受体状态、疏水性与局部几何描述符。模型引入交互注意力机制(interaction-aware attention),以强化蛋白与肽间信息流动,使得模型能够捕捉到协同结构变化。
层次化图神经网络评分模块
使用多层图卷积网络(融合 GIN 与 GAT)聚合节点特征并生成全局表示,输出复合物的结合评分。模型以实验结合能为监督信号,通过端到端学习优化参数,实现对复合物稳定性与亲和力的精准估计。

图1. GraphPep 框架结构
结果
对接程序生成的诱饵集性能
研究人员首先在 LEADS-PEP(bound/unbound) 与 Local_62(unbound/unbound) 基准集上,测试了 GraphPep 在 FlexPepDock、HADDOCK、HPEPDOCK 生成的诱饵集上的表现。
结果显示,GraphPep 在所有测试中均显著优于各对接程序自带打分函数与深度学习方法 InterPepScore。例如,在 HPEPDOCK 诱饵集上,GraphPep 在 Top-1、Top-3、Top-5 排名中的平均 DockQ 分数分别为 0.814、0.854、0.860,均高于其他方法。进一步分析表明,GraphPep 在多数复合物上能获得更高 DockQ 分数,并在无约束(unbound)结构条件下仍保持稳定性能。


在 ADCP 与 AFM 构建诱饵集上的表现
在 ADCP99 数据集 上,研究人员利用 ADCP 与 AlphaFold-Multimer (AFM) 生成诱饵集,对 GraphPep 进行测试。在 ADCP 诱饵集中,GraphPep 的中等精度与高精度成功率分别为 56.6% 与 31.3%,显著高于 ADCP (47.5%, 23.2%) 与 InterPepScore (51.5%, 25.3%)。在 AFM 诱饵集中,GraphPep 同样表现最优,并在共识评分策略下实现整体成功率 74.7%,高于所有比较方法。这些结果表明 GraphPep 具有较强的泛化能力,能在不同诱饵生成机制下稳定识别真实构象。

AlphaFold3 生成诱饵集上的表现
GraphPep 进一步在 nr_epitope_minus 抗体–肽复合物集 上验证性能。通过 AlphaFold3 强制采样生成的 121 组诱饵中,GraphPep 在中等与高精度标准下的成功率分别为 43.7% 与 15.6%,优于 AlphaFold3 原始评分与 InterPepScore。结果显示,随着肽长度增加,预测准确率下降,但 GraphPep 对短肽与中等长度肽的表现始终领先。在 DockQ 平均分上,GraphPep 为 0.469,较 AlphaFold3 (0.441) 与 InterPepScore (0.428) 均有提升。

预测结合模式实例
研究人员展示了多个典型案例(如 4DS1、2C3I、1T7R),对比 HPEPDOCK 与 GraphPep 的预测结果。
GraphPep 预测的结合构象与实验结构高度一致,能正确识别肽的方向、构象与二级结构类型。例如在 4DS1 中,GraphPep 的 DockQ 为 0.875,而 HPEPDOCK 仅为 0.469。此外,GraphPep 能为每对残基接触提供置信度评分,为后续结构优化提供指导依据。

讨论
GraphPep 提供了一种以“相互作用”为核心的全新图学习思路,用于蛋白–肽复合物的构象评分与结合能预测。
其核心创新包括:
节点定义革新:以相互作用为节点,而非传统的原子或残基;
基于接触学习:以残基–残基接触为目标,减少对大量诱饵样本的依赖;
多尺度融合:结合原子层与残基层信息,平衡精度与鲁棒性;
语言模型嵌入:引入 ESM-2 表征进化信息,增强泛化能力;
物理一致性:模型学习出的能量曲线呈“漏斗型”分布,可用于构象优化。
GraphPep 在多个独立数据集与不同来源诱饵上均表现优异,展现出广泛适用性。
此外,模型还能检测结构冲突、识别 α-螺旋与非螺旋肽的不同结合特征,具备生物物理解释力。
研究人员认为,GraphPep 可作为后续结构生成与肽药筛选的重要基础模型,并为未来结合生成式 AI 的蛋白–肽设计提供坚实框架。
整理 | DrugOne团队
参考资料
Tao, H., Wang, X. & Huang, SY. An interaction-derived graph learning framework for scoring protein–peptide complexes. Nat Mach Intell (2025).
https://doi.org/10.1038/s42256-025-01136-1

内容为【DrugOne】公众号原创|转载请注明来源
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢