DRUGONE
蛋白–配体结合亲和力预测是结构生物学与药物设计中的核心问题。然而,现有方法大多依赖高精度三维结构坐标,对晶体结构分辨率、实验误差以及预测结构质量高度敏感。当使用低分辨率结构或AlphaFold预测结构时,模型性能往往明显下降。
研究人员提出了一种新的蛋白–配体相互作用预测框架——E-CloudBind。该方法利用电子密度点云与分子图相结合的方式,同时建模非共价相互作用和共价拓扑结构,而不依赖亚埃级别的坐标精度。配体电子密度通过半经验量子化学计算获得,蛋白结合口袋则利用范德华半径约束的高斯点云进行近似表示,从而在保留空间相互作用信息的同时提高对结构噪声的容忍度。模型采用点云编码器提取氢键、π–π堆积和范德华作用等局部非共价特征,并利用异构图神经网络融合共价键与非共价作用信息,实现结合亲和力预测。在PDBbind多个标准测试集、AlphaFold结构测试以及分布外泛化场景中,E-CloudBind均达到或超过当前主流序列模型、图模型和结构模型性能,并表现出显著更强的鲁棒性。研究结果表明,电子密度点云能够有效摆脱对精确原子坐标的依赖,为异质结构条件下的结构驱动药物发现提供了一条新的技术路线。

药物发现过程中,蛋白–配体相互作用预测是筛选候选化合物的重要环节。传统实验方法虽然可靠,但成本高昂且效率有限,难以覆盖巨大的化学空间。因此,越来越多研究开始利用人工智能建立结合亲和力预测模型。
早期方法主要利用蛋白序列和SMILES序列进行建模,随后逐渐发展出基于分子图和三维结构的深度学习方法。虽然结构信息能够显著提升预测精度,但现有结构模型普遍依赖精确原子坐标和固定距离阈值来定义相互作用。例如,大多数模型采用5 Å以内原子接触作为非共价相互作用依据。
然而在真实环境中,蛋白结构往往存在显著不确定性。实验结构可能受到晶体堆积效应、辐射损伤以及模型拟合误差影响;而AlphaFold等预测结构则可能在柔性环区、侧链构象以及低置信度区域产生偏差。微小坐标误差就可能导致某些相互作用被错误识别或遗漏,从而影响模型学习效果。
研究人员认为,真正决定分子识别的并非原子中心之间的距离,而是电子云之间的空间重叠与相互作用。因此,需要一种能够反映电子分布本质、同时具有坐标扰动鲁棒性的分子表示方式。E-CloudBind正是在这一背景下提出的。
方法
E-CloudBind将蛋白–配体复合物表示为电子密度点云与分子图的联合结构。对于小分子配体,研究人员采用GFN2-xTB半经验量子化学方法计算电子密度分布,并构建三维电子云点集。对于蛋白质,由于直接计算电子密度成本过高,因此利用原子范德华半径建立多元高斯采样模型,近似模拟局部电子云分布。
随后,模型将电子云划分为多个局部区域,并通过三维点云卷积网络提取非共价相互作用特征。同时,蛋白与配体的原子和共价键被表示为异构分子图,通过图神经网络提取共价拓扑信息。最终,两类信息在多重作用力融合模块中整合,并通过异构图网络完成结合亲和力预测。
结果
E-CloudBind总体架构实现共价与非共价信息统一建模
研究人员首先构建了E-CloudBind整体框架。与传统球棍模型不同,E-CloudBind使用电子云表示原子间相互作用。电子云不仅能够反映氢键、范德华作用以及π–π堆积等相互作用本质,还能够避免固定距离阈值带来的误差。
模型主要由三部分组成:非共价相互作用点云编码器、共价作用异构图编码器以及多重作用力融合模块。点云编码器负责学习电子云空间结构中的非共价信息,图编码器学习分子内部共价键连接模式,而融合模块则联合利用两类信息进行亲和力预测。

图1: 传统原子距离建模与电子密度点云建模对比。
在PDBbind基准测试中达到领先性能
研究人员首先在PDBbind数据集上进行十折交叉验证。结果显示,E-CloudBind在平均绝对误差和Pearson相关系数两项核心指标上均优于SIGN、DMFF和PSICHIC等代表性方法。同时,与近期提出的EHIGN、FlowDock和Boltz-2相比,E-CloudBind同样保持领先表现。
研究人员认为,这种优势主要来源于电子云表示能够更真实地反映分子间非共价作用,而不是简单依赖原子间距离。

图2 E-CloudBind总体框架与PDBbind性能评估。
对结构分辨率变化具有显著鲁棒性
随后,研究人员系统分析蛋白结构分辨率对预测结果的影响。对于传统模型而言,随着结构分辨率下降,预测误差持续增加。特别是在柔性结合口袋区域,坐标误差会直接影响相互作用识别。
相比之下,E-CloudBind表现出极低的误差增长趋势。无论蛋白结构分辨率从高分辨率晶体结构下降到较低分辨率结构,其预测误差变化均远小于基线模型。
这一结果表明,电子云表示能够有效缓冲局部坐标误差带来的影响。
AlphaFold预测结构上保持稳定性能
研究人员进一步测试了实验结构与AlphaFold预测结构之间的性能差异。结果显示,当使用AlphaFold结构替代实验结构时,大多数模型性能明显下降。DMFF下降最为显著,而依赖距离定义相互作用的SIGN和PSICHIC也受到较大影响。
E-CloudBind则几乎保持原有性能,仅出现极小幅度变化。这说明模型对结构来源具有较强适应能力,能够同时处理实验结构和预测结构。随着AlphaFold数据库快速扩展,这种能力对于未来药物发现具有重要意义。

图3: 不同结构质量条件下的鲁棒性评估。
分布外场景下展现优异泛化能力
为了评估模型在真实药物发现场景中的表现,研究人员构建了基于DAVIS数据集的分布外测试集。测试集同时包含高复杂度蛋白和高复杂度配体,从而形成具有挑战性的泛化任务。
结果表明,E-CloudBind不仅获得最低预测误差,而且误差分布最集中。在不同蛋白复杂度和配体复杂度组合下,模型均保持稳定性能,而其他方法在复杂样本区域误差明显增加。
这一结果说明电子云表示具有较强的跨蛋白和跨化学空间泛化能力。

图4: 分布外泛化能力分析。
高斯电子云近似显著降低计算成本
研究人员随后分析电子密度计算策略。理论上,利用量子化学方法直接计算电子密度最为准确,但计算成本极高。研究团队提出基于范德华半径的高斯采样策略,对蛋白局部电子云进行近似建模。
实验结果显示,该近似方法与真实电子密度计算得到的预测性能几乎一致,但预处理时间从数十小时降低到约半小时量级。这一结果证明,高斯电子云表示能够在保持精度的同时大幅提升计算效率。
对刚性变换不敏感但依赖真实几何结构
研究人员进一步研究模型对空间扰动的响应。当电子云整体旋转或平移时,模型性能几乎不发生变化,说明E-CloudBind天然具有旋转和平移不变性。
然而,当局部电子云结构被随机破坏时,预测性能逐渐下降,并且随着扰动程度增加而持续恶化。这表明模型真正学习的是电子云中的空间几何模式,而不是简单的位置坐标信息。

图5: 电子云扰动实验。
注意力机制揭示关键非共价相互作用区域
为了验证模型可解释性,研究人员选取多个具有不同结构复杂度的蛋白–配体复合物进行分析。结果发现,模型始终将较高注意力分配给配体中的极性原子和功能基团。这些区域往往对应氢键供体、氢键受体以及芳香堆积作用位点。
随着蛋白复杂度增加,模型仍能准确定位关键结合区域,说明其学习到具有生物学意义的相互作用模式。

图6: 原子级可解释性分析。
大规模虚拟筛选验证药物发现潜力
研究人员进一步开展实际药物发现测试。他们选择细菌青霉素结合蛋白PBP1A、新冠病毒主蛋白酶Mpro以及抗凋亡蛋白BCL-2作为靶标,并从ZINC数据库中筛选80383个类药化合物。模型预测后选取排名前5%的候选分子进行分子对接验证。结果显示,多数候选分子的对接得分优于共晶配体。
随后,研究人员对BCL-2体系进一步开展400 ns分子动力学模拟。结果表明,筛选得到的候选分子在结合口袋内保持稳定构象,并表现出有利的结合自由能。
此外,合成可行性分析显示,大部分候选化合物均具有较好的可合成性,证明E-CloudBind不仅能够发现高亲和力分子,也能够筛选具有现实开发价值的候选药物。

图7: 大规模虚拟筛选与候选药物验证。
讨论
本研究提出的E-CloudBind首次系统性地将电子密度点云引入蛋白–配体亲和力预测任务。与传统基于原子距离的建模方法相比,该框架利用电子云重叠表征非共价相互作用,从而显著降低了对精确坐标的依赖。
研究结果表明,无论面对低分辨率实验结构、AlphaFold预测结构还是复杂分布外样本,E-CloudBind均保持稳定性能。这说明电子密度表示能够更真实地反映分子识别的物理本质,并提高模型在真实药物研发环境中的适用性。
此外,模型具有良好的可解释性和虚拟筛选能力。注意力分析能够定位关键相互作用位点,而大规模筛选实验则证明其能够发现具有潜在开发价值的新型候选化合物。
研究人员同时指出,目前模型尚未显式考虑极化效应和溶剂环境,并依赖预定义结合口袋。未来可以引入溶剂感知电子场、自动结合位点识别以及蛋白–配体构象生成等模块,进一步扩展该框架在结合构象预测、选择性优化以及AI驱动药物设计中的应用。
总体而言,E-CloudBind提出了一种从“原子坐标建模”迈向“电子密度建模”的新范式,为下一代结构基础模型和精准药物发现提供了新的理论与技术基础。
整理 | DrugOne团队
参考资料
Liu, Y., Wang, Y., Wang, Q. et al. An electron-density point-cloud framework for robust protein-ligand interaction prediction. Nat Commun (2026).
https://doi.org/10.1038/s41467-026-74196-5

内容为【DrugOne】公众号原创|转载请注明来源
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢