理解蛋白质配体相互作用是生命科学诸多领域的基础:从阐明细胞过程到开发疾病新疗法,都离不开对其机制的描述。这类相互作用能够触发信号级联反应、催化化学反应,或调控基因表达等关键生物学事件。作为细胞的主力军,蛋白质往往通过与小分子配体或其他蛋白质发生特异性结合来实现功能。然而,蛋白质结构具有天然的动态性,配体结合也常诱导其发生构象变化;因此,获得准确的结合构象是基于结构的药物设计的重要前提。通过在分子层面更精确地理解这些相互作用,我们可以更深入认识生物系统如何运转,以及更有针对性地调控其功能,从而实现治疗目的。

近日,中国科学院上海药物研究所郑明月团队提出蛋白配体复合物柔性结构建模新方法 PackDock。该方法将生成式 AI 与物理算法相结合,用于预测柔性蛋白配体对接构象,并在多种应用场景中展现出良好的精度与效率,同时具备较强的泛化能力。相关研究成果以 “Flexible protein–ligand docking with diffusion-based side-chain packing” 为题,于 2025 年 12 月 24 日在 Proceedings of the National Academy of Sciences of the United States of America(美国国家科学院院刊)在线发表。

图片

1. 背景

蛋白质的结构对于基础生物学和药物设计至关重要。过去几十年里,基于结构的药物设计(SBDD)已成为开发新药的核心策略;随着结构生物学技术与从头蛋白质折叠算法的快速发展,获取蛋白质三维结构变得前所未有地便捷。然而,蛋白质结构本质上是动态的,配体结合常伴随结合口袋内的构象变化,而现有结构多以静态快照的形式呈现,难以满足 SBDD 的复杂需求:例如,未结合配体的 apo 结构或结合非同源配体的 holo 结构,都可能导致对新配体真实结合模式的错误假设。因此,尽管准确的结合构象是 SBDD 的关键前提,它在实际研究与应用中仍往往难以直接获得。

传统分子对接算法通常依赖迭代式的构象采样与打分评估。为保证计算效率,这类方法往往忽略蛋白质柔性从而缩小搜索空间,但这可能错过关键的口袋构象变化并导致错误的结合模式。近年来,深度学习方法通过回归或生成式建模在一定程度上能够跳过反复的采样评估流程,显著提升对接速度,并在部分场景下带来更高精度;但由于神经网络对物理约束的显式建模不足,仍可能产生几何或能量上不合理的构象,从而对结果的可解释性与可信度提出挑战。与此同时,共折叠(Co-folding)方法的兴起进一步改变了关于蛋白质配体复合物结构预测的讨论:相较于传统对接方法,它们在多个任务上展现出更强的性能,但多项基准研究也提示,现有共折叠框架尚未学习到真实的物理相互作用规律。

在这项工作中,研究团队提出了柔性蛋白质建模框架 PackDock,通过整合物理建模与深度学习方法来表征蛋白质配体相互作用。其核心模块 PackPocket 结合等变图神经网络与扩散模型建模结合口袋内侧链构象的多峰分布从蛋白质自由态配体结合态的构象分布中采样,并通过预测侧链扭转角实现对蛋白质柔性的高效建模。为系统评估该方法,研究团队设计了一系列面向真实药物设计需求的基准实验,包括侧链恢复、柔性重对接,以及在apoholo 与预测折叠结构上的交叉对接测试,从而全面评估 PackDock 在不同结构来源下的柔性对接性能。此外,团队还在一个面向 ALDH1B1 的真实药物发现项目中,成功识别出具有新型骨架、纳摩尔级亲和力的候选化合物,进一步验证了 PackDock 的实用价值。

2. 结果

2.1 PackDock架构

图片

1. PackDock 方法示意图。aPackDock 工作流程bPackPocket 对侧链构象分布的建模c等变图神经网络预测侧链扭转角。

1所示,PackDock 同时考虑蛋白质在无配体(自由态)与配体结合态下的构象分布,从而更精准地建模柔性蛋白配体复合物的结合构象。具体而言,核心模块 PackPocket 结合等变图神经网络与生成式建模策略,学习侧链构象空间的能量景观,并在不同状态分布中采样口袋侧链构象,以描述结合过程中可能发生的构象变化。此外,PackDock 框架可兼容多种刚性对接算法,从而进一步提升柔对接性能。

2.2 对接的基础:蛋白侧链构象预测的准确性

图片

2. PackDock 与其他方法的侧链预测准确度对比a无配体条件下Packing性能b:以配体为条件的Packing性能c重对接过程中的侧链原子RMSDd重对接过程中的侧链扭转角MAE

蛋白质构象并非一成不变,尤其在配体结合口袋区域,口袋呼吸或变构效应常会驱动侧链重排,从而形成多种可能的构象状态。然而,现有方法多侧重于评估单一结构的准确性,难以生成多样且具有代表性的口袋构象集合。为此,PackDock 的核心模块 PackPocket 采用生成式建模学习并采样口袋侧链构象分布,并可进一步引入配体条件信息,以提升侧链预测的准确度2。此外,侧链构象空间极其庞大,传统柔性对接往往需要在采样评估的迭代过程中耗费大量计算以探索该空间;相比之下,PackPocket 通过直接建模与采样侧链构象分布,避免了大量迭代计算步骤,从而在提升精度的同时显著提高了计算效率。

2.3 真实结构偏差下的鲁棒性:apoholo结构的交叉对接

图片

3. PackDock 与其他方法的柔对接性能对比。a使用apo结构进行对接
性能b使用apo结构对接
RMSD < 1 Å 和 < 2 Å 的比例c使用holo结构进行对接的性能d使用holo结构对接
RMSD < 1 Å 和 < 2 Å 的比例。

在大多数实际应用中,获得与目标配体结合的holo结构往往十分困难,通常只能依赖apo结构或非同源配体的 holo 结构来开展分子对接研究。在这类场景下,若将蛋白质视为刚性结构、仅考虑配体柔性,往往导致错误的相互作用模式,从而限制对接结果的可靠性。为贴近真实应用,研究者分别以 apo 与非同源 holo 结构模拟上述输入条件并进行评测。如3所示,PackDock 在以 apo 或非同源holo 作为输入时的柔性对接性能均显著优于现有方法,体现了其在真实结构偏差条件下的鲁棒性与实用价值。

2.4 预测结构的可用性:折叠结构模型上的交叉对接

图片

4. 以共折叠方法预测结构作为输入时 PackDock 的对接性能。a:与其他共折叠方法在不同训练集相似度测试集上的对接性能对比;b:在主链 RMSD < 2 Å 的测试数据上的对接性能。

过去几十年,实验结构生物学已解析约 10 万个蛋白质结构,但这仍仅覆盖已知蛋白质序列空间的一小部分,因此人们寄希望于借助蛋白质折叠算法探索更广阔的序列图景。近年来,共折叠方法在预测过程中显式引入配体信息,相比传统分子对接在多个任务上展现出显著优势,也为 SBDD 带来了令人兴奋的新机遇。然而,多项基准测试同样揭示了其局限:部分方法可能尚未学习到真实的物理相互作用规律,而更依赖对训练集中配体姿态的记忆,从而在分布外结构上出现明显的性能衰减,引发了对其在药物发现应用中泛化能力的担忧。

PackDock 采用混合策略,将基于物理的分子对接与深度学习驱动的受体柔性建模相结合;这种组合在记忆式泛化失效时尤为有效。为评估其泛化性,研究者使用 Runs N Poses 数据集,并将评估范围限定在 Boltz-2 训练截止日期(2023 年 月)之后发布的结构,同时依据测试样本相对于训练集的相似度(SuCOS)进行分层分析。如4所示,PackDock 在低相似度(<60%)条件下取得了显著更高的对接成功率。尤其值得注意的是,当相似度低于 40% 时,PackDock 的性能相比 Boltz-2 提高约 20%,相比 Boltz-2-pocket 提高约 10%。这类低相似度样本往往最具挑战性,却也更贴近未来药物发现中常见的分布外应用场景。在高相似度条件下,当共折叠方法的准确率接近完美>90%)时,PackDock 的表现略低,但整体仍具有竞争力。总体而言,共折叠方法代表了 SBDD 的重要发展方向,但在物理可解释性与泛化性方面仍面临根本挑战;因此,与其将其视为传统对接的替代方案,不如将二者的优势互补结合,以覆盖更广泛、更真实的应用场景。

2.5 应用验证:前瞻性虚拟筛选实验

图片

5. PackDock 筛选 ALDH1B1 的新骨架化合物。a筛选流程示意图b筛选得到的 hit 分子与参考分子 IGUANA-1 的化学结构c个 hit 分子及参考分子的剂量反应曲线dhit 分子与参考分子对 ALDH1B1 蛋白热稳定性的影响e实验活性鉴定结果汇总fSPR 测定 484H9 与 ALDH1B1 的结合亲和力g484H9 与 ALDH1B1 的核磁共振实验。

为了评估 PackDock 在实际药物发现流程中的应用能力,研究团队 ALDH1B1 为靶点开展了一项前瞻性虚拟筛选实验,如5所示。通过使用 PackDock 对内部小分子库进行筛选,并对优选化合物进行多层级实验验证,最终获得 个具有新型骨架的 ALDH1B1 抑制剂,其中 个化合物表现出纳摩尔级的结合亲和力。该结果表明,PackDock 不仅在基准任务上具备优势,也能够在真实筛选中产出具有实际价值的命中分子,体现了其面向药物发现应用的潜力。

3.讨论

结构生物学技术与基于人工智能的蛋白质折叠算法迅速发展,使我们能够以前所未有的速度获得更多新型生物靶标的三维结构。然而,这些结构往往以静态快照的形式呈现,难以全面反映蛋白质在细胞环境中的动态特性,从而限制了我们对蛋白质配体相互作用的深入理解。为应对这一挑战,研究团队提出了 PackDock框架,旨在弥补静态结构在描绘结合过程与受体柔性方面的不足。

PackDock 将基于物理的分子对接与深度学习驱动的受体柔性建模相结合。研究者通过多项系统性评测验证了其能力:(1)侧链 packing 与柔性重对接实验表明 PackDock 能够准确预测结合位点侧链构象;(2)在以 apo 结构、非同源 holo 结构以及共折叠预测结构为输入的交叉对接测试中,PackDock 展现出在真实结构输入条件下柔对接的实用价值;(3)在针对 ALDH1B1 的前瞻性虚拟筛选中,PackDock 成功识别出具有新型骨架且达到纳摩尔级亲和力的抑制剂,进一步证明其在实际药物发现中的应用潜力。总体而言,PackDock 能够适配多来源的蛋白结构输入,并以较高精度预测蛋白配体复合物构象,从而推动对生物系统中蛋白配体相互作用的机制理解。作者认为,与其期待深度学习完全替代传统经验或物理方法,更值得关注的是如何整合不同方法的优势,以更有效地解决实际科学问题。

上海药物研究所硕士研究生张润泽、上海药物研究所博士研究生江欣雨、浙江大学与上海药物研究所联合培养博士研究生曹端华,以及上海药物研究所硕士研究生王照坤为本文共同第一作者。上海药物研究所郑明月研究员为本文通讯作者。本研究获得国家自然科学基金、国家重点研发计划、临港实验室中国科学院战略性先导科技专项等资助。

原文链接 

R. Zhang, X. Jiang, D. Cao, et al. Flexible protein–ligand docking with diffusion-based side-chain packing, Proc. Natl. Acad. Sci. U.S.A. 122 (52) e2511925122 (2025). 

https://doi.org/10.1073/pnas.2511925122点击下方阅读原文跳转)

内容中包含的图片若涉及版权问题,请及时与我们联系删除