Efficient 3D Molecular Generation with Flow Matching and Scale Optimal Transport

2024年06月11日
  • 简介
    最近,基于生成模型的三维药物设计因其直接在蛋白质口袋内设计配体的潜力而备受关注。然而,当前的方法往往具有非常缓慢的采样时间或生成具有较差化学有效性的分子。为了解决这些限制,我们提出了Semla,一种可扩展的E(3)-等变消息传递架构。我们进一步引入了一种分子生成模型MolFlow,该模型使用流匹配和尺度最优传输的新颖扩展进行训练。我们的模型仅使用100个采样步骤就可以在基准数据集上产生最先进的结果。关键是,MolFlow只需20个步骤就可以采样出高质量的分子,相比最先进的方法,速度提高了两个数量级,而不会牺牲性能。此外,我们强调了当前用于三维生成的评估方法的限制,并提出了无条件分子生成器的新基准指标。最后,使用这些新指标,我们比较了我们的模型生成高质量样本的能力与当前方法,并进一步展示了MolFlow的强大性能。
  • 图表
  • 解决问题
    本论文旨在解决当前3D分子生成模型中采样速度慢、生成的分子质量差等问题,提出了一种可扩展的E(3)-等变消息传递架构Semla和一种分子生成模型MolFlow。
  • 关键思路
    Semla是一种可扩展的E(3)-等变消息传递架构,MolFlow使用流匹配和等变最优传输的新扩展,通过100个采样步骤产生最先进的结果,并且在只有20个步骤的情况下生成高质量分子。
  • 其它亮点
    论文提出了新的评估指标来评估3D分子生成器的性能,与当前方法进行了比较,并展示了MolFlow的强大性能。论文使用了公开的基准数据集,同时提供了开源代码。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如DeepDriveMD、CondConv和3D-GAN等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论