Efficient 3D Molecular Generation with Flow Matching and Scale Optimal Transport

2024年06月11日
  • 简介
    最近,基于生成模型的三维药物设计因其能直接在蛋白质口袋中设计配体而备受关注。然而,目前的方法往往存在非常缓慢的采样时间或生成化学上不合规的分子。为了解决这些限制,我们提出了Semla,一种可扩展的E(3)-等变消息传递架构。我们进一步引入了一种分子生成模型SemlaFlow,它使用流匹配和尺度最优传输的新扩展进行训练。我们的模型仅需100个采样步骤就能在基准数据集上产生最先进的结果。关键是,SemlaFlow仅需20个步骤即可采样出高质量分子,相对于最先进的方法,速度提高了两个数量级,而不会牺牲性能。此外,我们强调当前3D生成评估方法的局限性,并提出了无条件分子生成器的新基准度量标准。最后,使用这些新的度量标准,我们比较了我们的模型生成高质量样本的能力与当前方法,并进一步证明了SemlaFlow的强大性能。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决3D药物设计中的分子生成问题,当前方法存在生成速度慢和分子化学有效性差的问题。
  • 关键思路
    本文提出了一种可扩展的E(3)-等变消息传递架构Semla,并使用流匹配和尺度最优传输的新扩展等变最优传输方法训练生成模型SemlaFlow。该模型在基准数据集上表现出最先进的结果,且速度比现有技术提高了两个数量级。
  • 其它亮点
    本文提出了新的评估指标,并将SemlaFlow与当前方法进行了比较,表现出了良好的性能。实验使用了哪些数据集和开源代码未提及。
  • 相关研究
    最近的相关研究包括:1)使用生成对抗网络进行分子生成;2)使用变分自编码器进行分子生成;3)使用强化学习进行分子生成。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问