- 简介材料发现需要在广阔的化学与结构空间中进行探索,同时满足多个常常相互冲突的目标。我们提出了由大语言模型引导的材料设计进化方法(LLEMA),这是一个统一的框架,将大型语言模型中蕴含的科学知识与基于化学原理的进化规则以及基于记忆的优化机制相结合。在每一次迭代中,大语言模型在明确的性能约束条件下提出具有完整晶体结构信息的候选材料;一个结合代理模型的评估器估算其理化性质;一个多目标评分模块则更新成功与失败的记忆,以指导后续的生成过程。在涵盖电子、能源、涂层、光学和航空航天领域的14项真实任务上的评估表明,LLEMA所发现的候选材料在化学上合理、热力学稳定且性能符合目标,在命中率和帕累托前沿方面均优于生成式模型和仅使用大语言模型的基线方法。消融实验验证了规则引导生成、基于记忆的优化以及代理预测的重要作用。通过强调整合可合成性要求与多目标权衡,LLEMA为加速实际材料发现提供了一条有理论依据的有效路径。 代码:https://github.com/scientific-discovery/LLEMA
-
- 图表
- 解决问题材料发现面临巨大的化学和结构空间搜索挑战,同时需要满足多个可能相互冲突的性能目标。传统方法效率低、探索范围有限,而现有生成模型或纯大语言模型方法往往缺乏对晶体结构可行性、热力学稳定性和实际可合成性的考虑。该论文试图解决如何高效、合理地探索材料空间,并在多目标约束下发现兼具科学合理性和性能优越性的新材料的问题。这是一个重要且现实的新问题,尤其在加速实际材料研发方面具有迫切需求。
- 关键思路提出LLEMA框架,将大型语言模型(LLM)中的科学知识与化学信息学引导的进化规则和基于记忆的优化机制相结合。通过LLM在属性约束下生成晶体结构明确的候选材料,利用代理模型预测物化性质,并通过多目标评分机制更新成功/失败记忆以指导后续迭代。其创新在于融合了LLM的知识先验、规则约束的合理性保障以及记忆驱动的持续优化,实现了知识引导下的智能进化设计。
- 其它亮点在电子、能源、涂层、光学和航空航天等14个真实任务上验证了LLEMA的有效性,结果表明其命中率更高、Pareto前沿更优,优于生成模型和仅用LLM的方法。实验设计严谨,强调化学合理性、热力学稳定性和性能对齐。代码已开源(https://github.com/scientific-discovery/LLEMA),具备良好可复现性和应用潜力。值得深入的方向包括扩展至更多材料类别、引入实验反馈闭环、提升LLM对复杂结构的理解能力。
- 1. 'Materials discovery with large language models: from text mining to property prediction' (2023) 2. 'Generative models for materials discovery: a survey of deep learning approaches' (2022) 3. 'Evolutionary algorithms in materials design: progress and challenges' (2021) 4. 'Multi-objective optimization in materials informatics using Gaussian processes' (2023) 5. 'Knowledge-informed machine learning in materials science' (2022)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流