Contrastive Geometric Learning Unlocks Unified Structure- and Ligand-Based Drug Design

2026年01月14日
  • 简介
    基于结构和基于配体的计算机辅助药物设计传统上依赖于相互独立的数据来源和建模假设,这限制了二者的大规模联合应用。本文提出“用于统一计算药物设计的对比几何学习模型”(ConGLUDe),这是一种单一的对比几何模型,能够整合基于结构和基于配体的训练方法。ConGLUDe结合了一个几何蛋白编码器,该编码器生成全蛋白的表示以及预测结合位点的隐式嵌入,同时搭配一个快速的配体编码器,从而无需预先定义结合口袋。通过对比学习将配体与全局蛋白表示及多个候选结合位点对齐,ConGLUDe不仅支持虚拟筛选和靶点发现,还能实现配体条件下的结合口袋预测,且模型可在蛋白-配体复合物和大规模生物活性数据上进行联合训练。在多种不同基准任务上的实验表明,ConGLUDe在输入中不提供任何结合口袋信息的情况下,实现了最先进的零样本虚拟筛选性能;在一项具有挑战性的靶点发现任务中显著优于现有方法;并在配体条件下的口袋选择任务中展现出具有竞争力的表现。这些结果凸显了结构与配体信息统一训练的优势,也标志着ConGLUDe朝着通用型药物发现基础模型迈出了重要一步。
  • 作者讲解
  • 图表
  • 解决问题
    传统的基于结构和基于配体的计算药物设计依赖于分离的数据源和建模假设,难以大规模联合使用。该论文试图解决如何统一结构和配体信息进行端到端药物发现的问题,尤其是在没有先验结合口袋信息的情况下实现虚拟筛选、靶点预测和结合位点识别。这一问题在当前药物发现领域具有挑战性,虽有相关尝试,但尚未实现真正统一的可扩展模型。
  • 关键思路
    提出ConGLUDe(Contrastive Geometric Learning for Unified Computational Drug Design),一种统一的对比几何学习框架,通过几何蛋白编码器生成全蛋白表示并隐式预测多个候选结合位点,结合快速配体编码器,在无需预定义口袋的前提下,利用对比学习对齐配体与蛋白全局及局部结构特征。其关键创新在于将结构和配体数据联合训练于单一模型,并支持多任务(如零样本虚拟筛选、靶点钓鱼、配体条件下的口袋选择)。
  • 其它亮点
    模型在多个基准上实现了最先进的零样本虚拟筛选性能,尤其在无输入结合口袋信息时显著优于现有方法;在具挑战性的靶点钓鱼任务中表现突出,并展现出竞争性的配体条件口袋选择能力。实验设计融合了蛋白质-配体复合物结构数据(如PDBbind)和大规模生物活性数据(如ChEMBL),验证了跨任务泛化能力。论文强调了统一训练的优势,为通用药物发现基础模型提供了新方向。目前未提及代码是否开源,但其方法论为后续开发多模态药物发现基础模型开辟了新路径,值得深入探索其在更大规模数据上的扩展与实际药物研发中的应用。
  • 相关研究
    1. DeepDTA: Deep Drug–Target Binding Affinity Prediction 2. Structural Modeling of Protein–Ligand Interactions with Geometric Deep Learning 3. PocketMiner: Zero-Shot Discovery of Ligand-Binding Pockets with Deep Geometry-Aware 3D Representations 4. EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction 5. AlphaFold-Multimer: A Structure Prediction Method for Protein–Protein Complexes 6. UniMol: A Universal 3D Molecular Representation for Molecules and Proteins
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问