PLA-SGCN: Protein-Ligand Binding Affinity Prediction by Integrating Similar Pairs and Semi-supervised Graph Convolutional Network

2024年05月13日
  • 简介
    本文旨在将半监督图卷积网络(GCN)应用于蛋白质-配体结合亲和力(PLA)预测中。PLA预测旨在预测配体是否能够与蛋白质序列结合。最近,深度学习在PLA预测中受到了广泛关注。基于深度学习的方法包括两个步骤:特征提取和任务预测。许多基于深度学习的方法集中于引入新的特征提取网络或整合辅助知识,如蛋白质-蛋白质相互作用网络或基因本体知识。然后,一个任务预测网络被设计为简单地使用一些全连接层。本文旨在通过半监督GCN将检索到的类似难处理的蛋白质-配体对集成到PLA预测中(即任务预测步骤)。对于每个输入查询样本,基于流形平滑约束检索难处理的蛋白质-配体对。然后,自动学习一个图,其中每个节点是一个蛋白质-配体对,每条边表示对之间的相似性。换句话说,提出了一个端到端的框架,同时检索难处理的类似样本,学习蛋白质-配体描述符,学习输入样本的图拓扑结构和检索到的类似难处理样本(学习邻接矩阵),并学习半监督GCN来预测结合亲和力(作为任务预测器)。训练步骤调整参数值,在推断步骤中,为每个输入样本微调学习模型。为了评估所提出的方法,将其应用于四个著名的PDBbind、Davis、KIBA和BindingDB数据集。结果表明,所提出的方法显著优于可比较的方法。
  • 图表
  • 解决问题
    本文旨在通过引入半监督图卷积网络(GCN)来整合检索到的相似蛋白质-配体对,以提高蛋白质-配体结合亲和力(PLA)预测的准确性。
  • 关键思路
    本文提出了一种端到端的框架,同时检索相似样本、学习蛋白质-配体描述符、学习输入样本的图拓扑结构、学习半监督GCN来预测结合亲和力。该方法相比当前领域中的其他方法,引入了半监督GCN和自动学习的图拓扑结构,同时利用硬样本检索来提高准确性。
  • 其它亮点
    本文的实验使用了四个公共数据集,结果表明该方法明显优于其他方法。此外,该方法还使用了半监督学习和自动学习的图拓扑结构,这些方法值得进一步研究。本文的代码已经开源。
  • 相关研究
    最近的相关研究包括:“DeepDTA: deep drug–target binding affinity prediction”和“GraphDTA: Predicting drug–target binding affinity with graph neural networks”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论