Reasoning-Driven Retrosynthesis Prediction with Large Language Models via Reinforcement Learning

向作者提问

NEW

简介

逆合成设计在有机合成和药物发现中至关重要，近年来受益于人工智能的快速发展而取得了显著进步。然而，现有方法在适用性和可解释性方面仍经常面临局限。传统的基于图或序列到序列的模型往往缺乏通用的化学知识，导致其预测结果既不够准确，也难以解释。为解决这些问题，我们提出了RetroDFM-R，这是一种基于推理的大型语言模型（LLM），专为化学逆合成设计而开发。RetroDFM-R利用基于可验证化学奖励机制的大规模强化学习进行训练，显著提升了预测准确性和可解释性。全面的评估表明，RetroDFM-R明显优于当前最先进的方法，在USPTO-50K基准测试中实现了65.0%的Top-1准确率。双盲人工评估进一步验证了RetroDFM-R预测结果的化学合理性和实际应用价值。此外，该模型还能准确预测文献中报道的真实药物分子和钙钛矿材料的多步逆合成路径。关键的是，RetroDFM-R的显式推理过程提供了人类可理解的洞察，从而增强了其在实际逆合成应用中的可信度和实用性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在解决有机合成与药物发现中的逆合成规划问题，现有方法在适用性和可解释性方面存在局限，传统模型缺乏通用化学知识，导致预测不够准确且难以解释。
关键思路

提出RetroDFM-R，一种基于推理的大型语言模型（LLM），专门用于化学逆合成。该模型利用基于化学可验证奖励的大规模强化学习，显著提高了预测的准确性与可解释性。
其它亮点

1. 在USPTO-50K基准测试中实现了65.0%的top-1准确率，显著优于现有最先进方法。 2. 通过双盲人类评估验证了其预测的化学合理性和实用性。 3. 能够准确预测真实药物分子和钙钛矿材料的多步逆合成路径。 4. 模型具有显式的推理过程，提供人类可解释的洞察，增强了在实际应用中的信任度和价值。 5. 实验设计包括与现有方法的全面对比评估，并验证了其在真实世界案例中的适用性。
相关研究

1. Graph-based approaches for retrosynthesis planning. 2. Sequence-to-sequence models in chemical synthesis prediction. 3. Reinforcement learning applications in molecular design. 4. Explainable AI in drug discovery and organic chemistry. 5. Language models applied to chemistry tasks.

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问