- 简介本文介绍了一种基于流的生成建模方法,用于学习和采样蛋白质的构象空间。作者利用AlphaFold和ESMFold等高精度单状态预测器,通过自定义流匹配框架对其进行微调,得到了一种称为AlphaFlow和ESMFlow的蛋白质结构序列条件生成模型。在PDB数据集上进行训练和评估时,与AlphaFold和MSA子采样相比,我们的方法提供了更高的精度和多样性。当在全原子MD的集合上进一步进行训练时,我们的方法可以准确地捕获未知蛋白质的构象灵活性、位置分布和高阶集合可观测量。此外,我们的方法可以通过更快的收敛速度将静态PDB结构多样化到某些平衡性质,而不需要进行昂贵的基于物理的模拟。代码可在https://github.com/bjing2016/alphaflow上获得。
- 图表
- 解决问题论文旨在开发一种基于流的生成建模方法,用于学习和采样蛋白质的构象空间。该方法旨在解决蛋白质结构的预测和生成问题。
- 关键思路论文使用高精度的单状态预测器(如AlphaFold和ESMFold),在自定义的流匹配框架下进行微调,以获得蛋白质结构的序列条件生成模型。该方法能够准确地捕捉蛋白质的构象灵活性和高阶集合可观测量。
- 其它亮点论文的方法在PDB上提供了比AlphaFold更高的精度和多样性。当进一步在全原子MD上训练时,该方法能够准确地捕捉未见过的蛋白质的构象灵活性、位置分布和高阶集合可观测量。此外,该方法还可以通过更快的收敛速度将静态PDB结构多样化,而不是复制MD轨迹,这证明了它作为昂贵的物理模拟的代理的潜力。代码已经开源。
- 与该论文相关的其他研究包括:1. AlphaFold的先前版本;2.使用GAN生成蛋白质结构的研究;3.其他流生成模型的研究,如Glow和RealNVP。
沙发等你来抢
去评论
评论
沙发等你来抢