在这项研究中,作者提出了GAT-GO,一种整合了预测的残基间接触图、蛋白质嵌入和序列特征以用于蛋白质功能预测的基于结构的深度学习方法。本文使用RaptorX来预测蛋白质序列的结构信息,使用Facebook的ESM-1b来生成蛋白质序列的残基级和序列嵌入。序列特征、蛋白质嵌入和碱基间接触图的结合导致了GAT-GO的主要优势之一,即它能够从局部和整体信息中共同预测蛋白质的功能。GAT-GO通过利用高分辨率的结构信息和高容量的预训练的蛋白质嵌入,超越了现有的功能预测方法,包括最近开发的基于结构的方法。本文的实验表明,蛋白质嵌入和预测的接触图,以及基于GAT的模型结构,都可以显著提高功能预测。
上图显示了GAT-GO的整体架构,输入序列首先被处理成一维特征(SA/SS/PSSM),并被送入一维CNN特征编码器以产生节点级特征嵌入。图注意力网络(GAT)将残基间接触图与节点级特征嵌入结合起来,生成一个序列级特征向量,然后由dense分类器用来预测GO的概率。
如上表所示,GAT-GO 在所有三个基因本体域中都大大优于对比方法BLAST、1D CNN 和 DeepFRI。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢