近日,来自哥伦比亚大学的 Peter B. Moore 和 Wayne A. Hendrickson、MRC 分子生物学实验室 Richard Henderson、以及斯坦福大学 Axel T. Brunger 在《Science》发表题为《The protein-folding problem: Not yet solved》的 Letter。
科学家表示:我们同意 HH Thorp 和许多其他人的观点,即计算机程序 AlphaFold 和 RoseTTAfold 在蛋白质结构预测方面取得的进展值得特别注意。这些新方法使用机器学习方法,利用实验蛋白质结构和序列数据库中包含的序列和结构之间的关系信息,预测的准确性大大优于以前的方法。然而,我们不同意 Thorp 关于蛋白质折叠问题已经解决的观点。
对于结构预测的关键评估(CASP14)数据集,AlphaFold 实现了 ∼1 Å 的平均 C-alpha 均方根偏差 (RMSD) 精度。这一精度与 X 射线晶体学或单粒子低温电子显微镜在极低分辨率下确定的结构的精度相对应。这些方法的准确性比机器学习方法好几倍;例如,在 3 Å 分辨率下,凭经验确定的结构的坐标 C-alpha RMSD 精度远优于 1 Å。目前,在最好的情况下,AlphaFold 预测结构的 C-α 坐标 RMSD 精度大致对应于在不超过 4 Å 的分辨率下确定的结构的预期精度。因此,尽管 AlphaFold 和 RoseTTAfold 的结构预测可能足够准确以协助实验结构确定,但它们本身无法提供分子机制研究和基于结构的药物设计所需的对分子和化学相互作用的详细理解。
结构预测的另一个复杂因素之处是给定序列中的动态结构变化。可能有显着差异的变构状态可能处于内在平衡或依赖于结合伴侣,其可能是配体或辅因子(例如,ATP 或钴胺素)、另一种大分子(例如,DNA 或蛋白质伴侣)或异常的自我关联(例如,致病性淀粉样蛋白)。解决蛋白质复合物的工作正在进行中,但对于那些在复杂分子机器中,以及那些具有影响构象的配体的结构预测仍有待实现,这可能尚未确定。
最近的进展应被视为进一步发展的要求。此外,应该从历史中吸取教训。1990 年,Alwyn Jones 和 Carl-Ivar Brändén 发表了一篇关于 X 射线晶体结构错误的评论,刺激了结构生物学交叉验证和验证工具的开发,并最终使实验结构数据库更加可靠。因此,应该开发工具来评估预测的坐标准确性,并减轻对存储库中观察到的结构模式的偏见。
最后,有必要思考一下解决这个词在蛋白质折叠问题的背景下可能意味着什么。有些人可能认为,一旦找到任何能够从蛋白质序列中准确预测蛋白质结构的方法,这个问题就会得到解决。AlphaFold 和 RoseTTAfold 代表了朝着这个方向迈出的重要一步,但它们并不是最终的答案。包括我们在内的其他人认为,解决蛋白质折叠问题意味着从基于基本物理和化学的第一原理开始,从氨基酸序列中准确预测结构。尽管在蛋白质结构预测方面取得了这些重大进展,但实验结构测定仍然必不可少。

参考内容:https://www.science.org/doi/10.1126/science.abn9422

内容中包含的图片若涉及版权问题,请及时与我们联系删除