DeepRetro: Retrosynthetic Pathway Discovery using Iterative LLM Reasoning

2025年07月07日
  • 简介
    逆合成分析(即为目标化合物寻找前体分子)对于合成复杂分子至关重要,但其在发现超出预设模板的新型合成路径方面仍面临挑战。近年来,大型语言模型(LLM)在逆合成领域的应用展现出了一定潜力,但如何有效利用LLM的推理能力进行高效的多步规划仍然是一个尚未解决的问题。为应对这一挑战,我们提出了DeepRetro——一个开源、迭代式、基于LLM的混合逆合成框架。 我们的方法将传统的基于模板/蒙特卡洛树搜索工具的优势与LLM的生成能力相结合,并通过逐步反馈机制实现协同工作。具体来说,首先尝试使用基于模板的引擎进行合成路线设计;若失败,则由LLM进一步提出单步逆合成断键建议。关键在于,这些建议必须经过严格的合法性、稳定性和幻觉检查,确认无误后,所得到的前体分子才会被递归地重新输入到流程中进行进一步评估。这种迭代优化机制实现了对合成路径的动态探索和修正。 我们通过基准测试和案例研究展示了该流程的潜力,证明了其能够识别出可行且潜在新颖的逆合成路径。特别是,我们开发了一个交互式图形用户界面,使专家化学家能够以“人在回路”方式向推理算法提供反馈。这种方法成功生成了针对复杂天然产物分子的新颖合成路径,展示了迭代式LLM推理在推动复杂化学合成领域前沿发展方面的巨大潜力。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决复杂分子逆合成分析中发现超越预定义模板的新型路径的挑战。当前基于大型语言模型(LLM)的方法在多步规划中的有效推理能力仍然有限。
  • 关键思路
    提出了一种名为DeepRetro的开源、迭代式混合LLM框架,结合了传统基于模板/蒙特卡洛树搜索工具的优势和LLM的生成能力。其核心创新在于通过逐步反馈循环机制,在模板引擎失败时由LLM提出单步逆合成断开建议,并进行严格验证后递归评估,从而实现动态路径探索与修正。
  • 其它亮点
    1. 开发了一个交互式图形用户界面,使专家化学家能够参与人类反馈闭环,提升路径生成质量 2. 展示了该方法在基准测试和案例研究中的潜力,成功生成复杂天然产物的新合成路径 3. 强调了LLM迭代推理在推动复杂化学合成领域前沿的潜力 4. 代码开源,促进未来研究和实际应用
  • 相关研究
    1. Recent advances in template-free retrosynthesis using large language models (2023) 2. Monte Carlo Tree Search for efficient reaction path planning in organic synthesis (2022) 3. Generative AI in chemical synthesis planning: Current trends and challenges (2024) 4. Interactive AI systems for chemist-in-the-loop retrosynthetic analysis (2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问