- 简介高通量反应条件筛选对于化学合成至关重要。然而,目前的反应条件筛选存在着费时费力的试错工作流程。传统的计算机辅助合成规划工具由于数据稀疏和反应表示不足而无法找到合适的反应条件。现今,大型语言模型能够解决与化学相关的问题,例如分子设计和化学逻辑问答任务。然而,大型语言模型尚未实现对化学反应条件的准确预测。在这里,我们提出了MM-RCR,一种文本增强的多模态大型语言模型,它从SMILES、反应图和文本语料库中学习统一的反应表示,用于化学反应条件推荐。为了训练MM-RCR,我们构建了120万对问答指令数据集。我们的实验结果表明,MM-RCR在两个公开基准数据集上实现了最先进的性能,并在域外和高通量实验数据集上展现了强大的泛化能力。MM-RCR有潜力加速化学合成中的高通量条件筛选。
- 图表
- 解决问题本文旨在解决化学合成中高通量反应条件筛选的困难和成本高的问题,提出了一种基于多模态大语言模型的化学反应推荐方法。
- 关键思路本文提出的MM-RCR模型利用SMILES、反应图和文本语料库构建了统一的反应表示,并通过1.2百万个问答指令数据集进行训练,实现了在两个公开基准数据集上的最先进表现和对OOD和HTE数据集的强大泛化能力。
- 其它亮点实验结果表明,MM-RCR模型的性能优于传统计算机辅助合成规划工具。本文还介绍了模型的设计和实验细节,包括使用的数据集、评价指标和开源代码。MM-RCR模型的提出有望加速化学合成中的高通量反应条件筛选。
- 近年来,大语言模型在化学领域的应用越来越多,例如分子设计和化学逻辑问答。然而,目前还没有大语言模型能够准确预测化学反应条件。
沙发等你来抢
去评论
评论
沙发等你来抢