AlphaFold Meets Flow Matching for Generating Protein Ensembles

Bowen Jing ,
Bonnie Berger ,
Tommi Jaakkola
2024年02月07日
  • 简介
    本文介绍了一种基于流的生成建模方法,用于学习和采样蛋白质的构象空间。作者利用AlphaFold和ESMFold等高精度单状态预测器,通过自定义流匹配框架对其进行微调,得到了一种称为AlphaFlow和ESMFlow的蛋白质结构序列条件生成模型。在PDB数据集上进行训练和评估时,与AlphaFold和MSA子采样相比,我们的方法提供了更高的精度和多样性。当在全原子MD的集合上进一步进行训练时,我们的方法可以准确地捕获未知蛋白质的构象灵活性、位置分布和高阶集合可观测量。此外,我们的方法可以通过更快的收敛速度将静态PDB结构多样化到某些平衡性质,而不需要进行昂贵的基于物理的模拟。代码可在https://github.com/bjing2016/alphaflow上获得。
  • 图表
  • 解决问题
    论文旨在开发一种基于流的生成建模方法,用于学习和采样蛋白质的构象空间。该方法旨在解决蛋白质结构的预测和生成问题。
  • 关键思路
    论文使用高精度的单状态预测器(如AlphaFold和ESMFold),在自定义的流匹配框架下进行微调,以获得蛋白质结构的序列条件生成模型。该方法能够准确地捕捉蛋白质的构象灵活性和高阶集合可观测量。
  • 其它亮点
    论文的方法在PDB上提供了比AlphaFold更高的精度和多样性。当进一步在全原子MD上训练时,该方法能够准确地捕捉未见过的蛋白质的构象灵活性、位置分布和高阶集合可观测量。此外,该方法还可以通过更快的收敛速度将静态PDB结构多样化,而不是复制MD轨迹,这证明了它作为昂贵的物理模拟的代理的潜力。代码已经开源。
  • 相关研究
    与该论文相关的其他研究包括:1. AlphaFold的先前版本;2.使用GAN生成蛋白质结构的研究;3.其他流生成模型的研究,如Glow和RealNVP。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论