2022年5月30日,以色列特拉维夫大学Blavatnik计算机科学学院的Haim J. Wolfson等人在Nat Methods杂志发表文章,提出了一种可解释的深度学习模型,该模型直接从原始数据中学习具有功能的结构基序 (motifs),从而可以将蛋白质结合位点和抗体表位准确地映射到蛋白质结构上。

论文链接:

https://www.nature.com/articles/s41592-022-01490-7

摘要

从蛋白质的结构中预测其功能位点 (如小分子、其他蛋白质或抗体的结合位点),可以了解其在体内的功能。目前,主要有两类方法:建立在手工创建的特征之上的机器学习模型和比较模型。它们分别受限于手工创建的特征的表现力和类似蛋白质的可用性。在这里,我们介绍了ScanNet,一个端到端的、可解释的几何深度学习模型,它直接从三维结构中学习特征。ScanNet根据原子和氨基酸相邻的空间化学排列建立了原子和氨基酸的表征。

我们训练ScanNet检测蛋白质-蛋白质和蛋白质-抗体结合位点,结果证明了其准确性,而且学到的滤波器 (filters) 是可解释的。最后,我们预测了SARS-CoV-2 刺突蛋白的表位,验证了已知的抗原区域,并预测到以前未被描述的抗原区域。总的来说,ScanNet是一个通用的、强大的、可解释的模型,适合于功能位点的预测任务。

ScanNet的网络服务器:

http://bioinfo3d.cs.tau.ac.il/ScanNet/

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除