【论文标题】Deep geometric representations for modeling effects of mutations on protein-protein binding affinity
【作者团队】 Xianggen Liu,Yunan Luo,Pengyong Li,Sen Song ,Jian Peng
【发表时间】2021/08/04
【机 构】清华、伊利诺伊香槟分校
【论文链接】https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1009284
【代码链接】https://github.com/Liuxg16/GeoPPI
【推荐理由】自监督图神经网络提取蛋白表征
模拟氨基酸突变对蛋白质-蛋白质相互作用的影响在蛋白质工程和药物设计中起着关键作用。本文开发了GeoPPI,一个新的基于结构的深度学习框架来预测突变后的结合亲和力的变化。基于蛋白质的三维结构,GeoPPI首先通过自监督的学习方案,学习编码蛋白质结构拓扑特征的几何表征。然后,这些表征被用作训练梯度增强树的特征,以预测突变后蛋白质-蛋白质结合亲和力的变化。作者发现,GeoPPI能够学习有意义的特征,以描述蛋白质结构中原子之间的相互作用。通过广泛的实验,作者发现GeoPPI在预测六个基准数据集的单点和多点突变后的结合亲和力变化方面取得了新的先进性能。此外,我们表明GeoPPI可以准确地估计最近发现的几种SARS-CoV-2抗体与S蛋白的受体结合域(RBD)之间的结合亲和力差异。这些结果证明了GeoPPI作为蛋白质设计和工程中一个强大而有用的计算工具的潜力。
图A:自监督的学习方案,在此过程中,几何编码器学习重建一个复合物的原始结构(其中一个残基的侧链扭转角是随机采样的)。几何编码器是一个神经网络,对图形结构进行神经信息传递操作。几何编码器的输入是一个复合体的图结构,我们只考虑与变异残基或界面残基不超过预定距离的原子,以降低计算的复杂性(材料和方法)。
图B:GeoPPI的预测过程,预训练的几何编码器分别为给定的野生型复合物和突变体产生几何表征,梯度提升树(GBT)将这些表征作为输入,预测相应的亲和力变化。
各个上图分别为
(A) 不同扰动距离的原子的学习表示空间。
(B)通过初始化的神经权重(即权重不是通过自监督学习来调整的)的扰动原子的表表征空间。
(C) 学习到的α-碳原子的表示空间,其中颜色代表它们在复合体中的位置(在界面上或不在界面上)。
(D) 通过初始化神经权重的α-碳原子空间。
(E)学习的氨基酸空间,其中颜色代表相应的组别。
(F)通过初始化神经权重的氨基酸空间。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢