- 简介准确预测蛋白质-配体结合亲和力对于快速高效的药物开发至关重要。近年来,预测结合亲和力的重要性引起了越来越多的关注,研究人员使用图神经网络对蛋白质-配体复合物的三维结构进行建模以预测结合亲和力。然而,传统方法往往无法准确地模拟复合物的空间信息,或者仅依赖于几何特征,忽视了蛋白质-配体结合的原则。这可能导致过度拟合,从而使模型在独立数据集上表现不佳,最终降低其在实际药物开发中的实用性。为了解决这个问题,我们提出了SPIN模型,该模型旨在通过整合适用于此任务的各种归纳偏差,而不仅仅是在经验数据集上进行训练,以实现更好的泛化性能。对于预测,我们定义了两种归纳偏差:几何角度和物理化学角度。前者保持一致的结合亲和力预测,而不考虑复合物的旋转和平移;后者需要在反应坐标轴上达到最小结合自由能,以实现有效的蛋白质-配体结合。这些先验知识输入使SPIN在CASF-2016和CSAR HiQ等基准数据集中优于比较模型。此外,我们通过虚拟筛选实验展示了我们模型的实用性,并通过评估其可解释性的实验验证了我们提出的模型的可靠性和潜力。
- 图表
- 解决问题论文旨在解决蛋白质-配体结合亲和力的准确预测问题,尤其是在使用图神经网络模型建模时存在的空间信息建模不准确和过度拟合问题。
- 关键思路SPIN模型结合了几种归纳偏差,包括几何和物理化学角度的先验知识,以提高模型的泛化能力和预测精度。
- 其它亮点SPIN模型在CASF-2016和CSAR HiQ数据集上表现优于其他模型,并且在虚拟筛选实验中表现出可靠性和潜力。论文提出的先验知识输入可以提高模型的解释性。论文开源了代码。
- 最近的相关研究包括《Protein-ligand binding affinity prediction using graph neural networks with edge attention》和《DockingNet: A unified framework for protein-ligand docking》。
沙发等你来抢
去评论
评论
沙发等你来抢