Generative Molecular Design with Steerable and Granular Synthesizability Control

2025年05月13日
  • 简介
    小分子生成设计中的可合成性仍然是一个瓶颈。现有的考虑可合成性的研究可以为生成的分子输出预测的合成路线。然而,对于简化合成过程以及灵活纳入所需反应约束的研究却鲜有关注。在本工作中,我们提出了一种小分子生成设计框架,该框架能够实现对可合成性的可控和精细调节。生成的分子可以满足任意多参数优化目标,其预测的合成路线包含预定义的允许反应,同时可以选择性避免其他反应。此外,还可以强制要求所有反应属于预定义的反应集合。我们展示了如何在最常见的药物化学转化中混合和匹配这些反应约束的能力。接下来,我们展示了如何利用我们的框架将工业副产品转化为从头优化的分子。进一步地,我们演示了如何通过精细控制可合成性约束来松散模拟超大型按需制造库的虚拟筛选。仅使用单个GPU,我们生成并对接了15,000个分子,以识别出构成142亿按需制造分子库(仅评估了该库的0.00001%)中具有潜力的候选分子。满足反应约束的生成分子具有超过90%的精确匹配率。最后,我们将我们的框架与最近的受可合成性约束的生成模型进行了基准测试,并证明即使在额外施加所有分子必须通过单一反应类型合成的约束下,我们的框架仍具有最高的采样效率。本文的核心主题是展示如何通过强化学习激励一个预训练的通用分子生成模型,在具有挑战性的可合成性约束下生成经过性质优化的小分子。
  • 图表
  • 解决问题
    该论文试图解决小分子生成设计中合成可行性的瓶颈问题,尤其是如何灵活地将所需的反应约束纳入生成过程。这是一个长期存在的挑战,但目前很少有工作能够同时实现多参数优化和精确的合成路径控制。
  • 关键思路
    论文提出了一种基于强化学习的小分子生成框架,通过预定义允许或禁止的反应类型,实现对合成可行性的可控性和灵活性。与现有方法不同,该框架不仅支持生成满足特定属性的小分子,还能确保生成的分子具有明确的合成路线,并且可以限制所有反应属于某一预定义集合。这种思路结合了生成模型和化学反应规则,为分子设计提供了更精细的控制能力。
  • 其它亮点
    1. 框架能够灵活设置反应约束,例如指定某些反应必须或不能出现;2. 展示了如何利用工业副产物生成优化分子;3. 在大规模虚拟筛选中表现出高效性,仅用单个GPU即可从142亿个分子库中生成并评估15k个候选分子;4. 提供了与最新方法的基准对比,证明在严格合成约束下仍保持高样本效率;5. 论文未提及代码开源情况,但实验设计详尽,涵盖多种应用场景,如药物化学转化和自由度4.0分子库筛选。
  • 相关研究
    近期相关研究包括:1.《MolecularRetro: Retrosynthesis Prediction with Reinforcement Learning》探讨了使用强化学习进行逆合成分析;2.《Reinventing the Molecule: Machine Learning for De Novo Molecular Design》关注无监督分子生成;3.《Constrained Graph Variational Autoencoders for Molecule Optimization》提出了图自编码器用于分子优化;4.《Chemical Transformer: A Pretrained Language Model for Molecules》展示了预训练语言模型在化学领域的应用。这些研究大多集中在分子生成或优化上,但较少涉及精确的合成路径控制。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论