每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
Generative Molecular Design with Steerable and Granular Synthesizability Control
2025年05月13日
小分子生成设计中的可合成性仍然是一个瓶颈。现有的考虑可合成性的研究可以为生成的分子输出预测的合成路线。然而,对于简化合成过程以及灵活纳入所需反应约束的研究却鲜有关注。在本工作中,我们提出了一种小分子生成设计框架,该框架能够实现对可合成性的可控和精细调节。生成的分子可以满足任意多参数优化目标,其预测的合成路线包含预定义的允许反应,同时可以选择性避免其他反应。此外,还可以强制要求所有反应属于预定义的反应集合。我们展示了如何在最常见的药物化学转化中混合和匹配这些反应约束的能力。接下来,我们展示了如何利用我们的框架将工业副产品转化为从头优化的分子。进一步地,我们演示了如何通过精细控制可合成性约束来松散模拟超大型按需制造库的虚拟筛选。仅使用单个GPU,我们生成并对接了15,000个分子,以识别出构成142亿按需制造分子库(仅评估了该库的0.00001%)中具有潜力的候选分子。满足反应约束的生成分子具有超过90%的精确匹配率。最后,我们将我们的框架与最近的受可合成性约束的生成模型进行了基准测试,并证明即使在额外施加所有分子必须通过单一反应类型合成的约束下,我们的框架仍具有最高的采样效率。本文的核心主题是展示如何通过强化学习激励一个预训练的通用分子生成模型,在具有挑战性的可合成性约束下生成经过性质优化的小分子。
140
热度
PDF
解读
Assessing the Chemical Intelligence of Large Language Models
2025年05月12日
大型语言模型是一种多功能的通用工具,具有广泛的应用场景。近期,“推理模型”的出现显著提升了这些模型在高级问题解决领域(如数学和软件工程)中的能力。在本研究中,我们评估了推理模型在没有任何外部工具辅助的情况下直接执行化学任务的能力。为此,我们创建了一个名为 ChemIQ 的新基准测试,其中包含 796 道题目,用于评估有机化学的核心概念,重点在于分子理解和化学推理。与以往主要采用选择题形式的基准测试不同,我们的方法要求模型生成简答题形式的回答,这种方式更贴近实际应用场景。以 OpenAI 的 o3-mini 为例的推理模型根据所使用的推理级别不同,正确回答了 28%-59% 的问题,且更高的推理级别显著提高了所有任务的表现。这些模型大幅超越了非推理模型 GPT-4o,后者仅达到了 7% 的准确率。我们发现,当前的大型语言模型已能够将 SMILES 字符串转换为 IUPAC 名称,而这是早期模型无法完成的任务。此外,我们还证明了最新的推理模型可以从 1H 和 13C 核磁共振(NMR)数据推导出分子结构,并为包含多达 10 个重原子的分子生成正确的 SMILES 字符串,准确率达到 74%,并且在某些情况下成功解析了包含 21 个重原子的复杂结构。对于每一项任务,我们都发现了证据表明模型的推理过程与人类化学家相似。我们的研究结果表明,最新的推理模型已经具备进行高级化学推理的能力。
139
热度
PDF
解读