- 简介深度生成模型可以产生新的分子结构,有潜力促进化学发现。目前,扩散模型已经实现了三维分子生成的最先进性能。在这项工作中,我们探讨了流匹配的使用,这是一个最近提出的生成建模框架,可以推广扩散模型,用于de novo分子生成任务。流匹配提供了模型设计的灵活性;然而,该框架基于连续值数据的假设。三维de novo分子生成需要同时对连续和分类变量进行采样,例如原子位置和原子类型。我们通过构建流,使其限制在称为概率单形的分类数据的连续表示上,将流匹配框架扩展到分类数据。我们称这个扩展为SimplexFlow。我们探讨了使用SimplexFlow进行de novo分子生成的可能性。然而,我们发现,在实践中,不做任何对数据分类性的适应的更简单的方法可以获得等效或更优的性能。作为这些实验的结果,我们提出了FlowMol,这是一个用于3D de novo生成模型的流匹配模型,可以实现比以前的流匹配方法更好的性能,并且我们提出了关于为实现流匹配模型的强大性能设计先前分布的重要问题。可用于复制此工作的代码和训练模型可在https://github.com/dunni3/FlowMol上找到。
- 图表
- 解决问题论文旨在探索使用流匹配模型生成新的分子结构,尤其是针对三维分子结构的生成。同时,论文也试图探索如何将流匹配模型扩展到分类数据的生成任务中。
- 关键思路论文提出了一种名为SimplexFlow的扩展流匹配模型,用于处理连续和分类变量的联合采样。然而,实验结果表明,不考虑分类数据的特殊性能够获得同样甚至更好的性能。
- 其它亮点论文提出了FlowMol模型,用于三维分子结构的生成,并在实验中展示了其优于先前的流匹配模型的性能。同时,论文还探讨了先验分布的设计对于流匹配模型性能的影响。论文提供了代码和训练模型,方便其他研究者进行复现和进一步研究。
- 在这个领域中,最近还有其他相关研究,如PixelCNN、VAE和GAN等模型在分子生成方面的应用。
沙发等你来抢
去评论
评论
沙发等你来抢