治疗性抗体构成了生物制品市场中一个快速增长的部分。然而,抗体的合理设计由于依赖实验方法来确定抗体结构而受到阻碍。近年来,深度学习方法已经推动了一般蛋白质结构预测的重大进展。在这里,我们提出了DeepAb,一种深度学习方法,用于从序列中预测准确的抗体FV结构。我们在两个基准集上对DeepAb进行了评估,一个是结构多样性的平衡,另一个是由临床阶段的治疗性抗体组成,并发现我们的方法一直优于领先的替代方法。以前的深度学习方法是作为 "黑盒子 "运行的,对其预测的见解很少。通过引入一个可解释的注意力机制,我们表明我们的网络注意到了物理上重要的残基对。例如,在预测一个CDR H3残基的构象时,网络注意到近端芳香族和一个关键的氢键相互作用,从而制约了环形构象。最后,我们提出了一个来自网络置信度的新型突变体评分标准,并表明对于某个特定的抗体,所有八个排名靠前的突变体都能提高结合亲和力。这些结果表明,这个模型对于广泛的抗体预测和设计任务是有用的。
总结:准确的结构模型对于理解潜在的治疗性抗体的特性至关重要。传统的蛋白质结构测定方法需要投入大量的时间和资源,并且可能失败。尽管有了很大的改进,但一般的蛋白质结构预测方法仍然不能持续提供理解或设计抗体所需的准确性。我们提出了一种用于抗体结构预测的深度学习方法,并证明了在不同的、与治疗相关的基准上比其他方法的改进。除了准确性的提高,我们的方法还揭示了关于特定氨基酸和残基相互作用的可解释性输出,这应该有助于设计新型的治疗性抗体。
上图为DeepAb的流程图,该网络从重链和轻链的序列开始,预测了一套FV结构的残基间几何形状,随后预测结果被用于指导Rosetta的结构优化。该网络中包含两个可解释的部分,预训练的抗体序列模型和注意力机制。
上图展示了DeepAb对CDR H3 loop的预测效果。(A) RosettaAntibody-G(RAb)、RepertoireBuilder(RB)、ABodyBuilder(ABB)和DeepAb在两个基准上预测的H3 loop的平均RMSD。(B) 所有基准目标的H3 loop长度的平均RMSD。(C) DeepAb和其他方法H3 loop RMSD的直接比较,对角线带表示预测在±0.25 Å以内。 (D) 利妥昔单抗H3 loop结构(白色,PDB ID 3PP3)与DeepAb(绿色,2.1 Å RMSD)和其他方法(蓝色,3.3-4.1 Å RMSD)预测的比较。(E) sonepcizumab H3 loop结构(白色,PDB ID 3I9G)与DeepAb(绿色,1.8 Å RMSD)和其他方法(蓝色,2.9-3.9 Å RMSD)预测结果的比较。
上图展示了模型可解释性,(A)注意力机制图和H3 loop注意力矩阵的例子,注意力值从蓝色增加到红色。(B) 在预测一个抗体(PDB ID 4H0H)的每个CDR环时,对FV结构的模型注意力。(C) 通过注意力确定H3 loop结构预测的关键相互作用。前五个非H3出席的残基(H32-Y,L32-Y,L49-Y,L55-F,和L91-S)被标记,以及一个参与氢键的H3残基(H100-S)。(D) 序列的LSTM嵌入的二维t-SNE投影。E)在CDR1 loop残基上的LSTM嵌入平均的二维t-SNE投影。
上图为使用DeepAb预测突变影响的结果。A)任意残基对的模型输出预测的ΔCCE计算示意图。图中显示了进行突变后该残基对的预测几何形状的概率密度变化。(B) 网络指标与实验结合富集的关系图,两个轴的负值对应于有益突变,真阳性预测(红色)和对野生型半胱氨酸的突变(黄色)被注意到。(C) 用组合网络指标和每个网络指标单独预测实验性结合富集超过野生型的TP-FP曲线结果。(D)抗溶菌酶FV结构上真阳性预测的位置。(E) 按组合指标排列的突变体的阳性预测值。F)设计的八突变体(D44.1des,红色)的ΔCCE与相同位置的随机突变的序列的比较。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢