Siamese Foundation Models for Crystal Structure Prediction

2025年03月13日
  • 简介
    晶体结构预测(CSP)旨在从化学成分出发生成稳定的晶体结构,是发现新型材料的关键途径。尽管在其他领域(例如蛋白质)的结构预测任务中已经取得了显著进展,但由于晶体结构固有的几何复杂性,CSP仍然是一个相对未被充分探索的领域。在本文中,我们提出了专门针对CSP设计的孪生基础模型。我们的预训练-微调框架名为DAO,包含两个互补的基础模型:用于结构生成的DAO-G和用于能量预测的DAO-P。在CSP基准测试(MP-20和MPTS-52)上的实验表明,我们的DAO-G在所有指标上均显著超越现有最先进的方法(SOTA)。广泛的消融研究进一步证实,DAO-G在生成多态晶体结构方面表现出色,而DAO-P提供的数据集松弛和能量引导对于提升DAO-G的性能至关重要。在应用于三个已知难以分析的实际超导体($\text{CsV}_3\text{Sb}_5$、$\text{Zr}_{16}\text{Rh}_8\text{O}_4$ 和 $\text{Zr}_{16}\text{Pd}_8\text{O}_4$)时,我们的基础模型能够实现关键温度的精确预测和结构的准确生成。例如,在$\text{CsV}_3\text{Sb}_5$中,DAO-G生成了一个与实验结果非常接近的结构,其均方根误差(RMSE)仅为0.0085;DAO-P则以高精度预测了临界温度$T_c$值(2.26 K,真实值为2.30 K)。相比之下,传统的密度泛函理论(DFT)计算工具(如Quantum Espresso)仅能在可接受的时间内成功推导出第一个超导体的结构,但其RMSE几乎是我们的8倍,且计算速度慢了超过1000倍。这些令人信服的结果共同凸显了我们方法在推动材料科学研究与开发方面的巨大潜力。
  • 图表
  • 解决问题
    本论文试图解决晶体结构预测(CSP)问题,即根据化学组成生成稳定且多样的晶体结构。这是一个复杂的问题,因为晶体结构的几何形状比其他领域(如蛋白质结构预测)更复杂。虽然CSP是材料科学中的关键任务,但目前仍是一个相对未被充分探索的领域。
  • 关键思路
    论文提出了一种基于Siamese架构的预训练-微调框架DAO,包含两个互补的基础模型:DAO-G用于生成晶体结构,DAO-P用于预测能量。DAO-G通过生成多样化和准确的多态结构显著超越了现有方法,而DAO-P则通过提供数据集松弛和能量引导来增强DAO-G的性能。这种方法结合了生成与能量预测的能力,为CSP提供了全新的解决方案。
  • 其它亮点
    1. 在MP-20和MPTS-52基准测试中,DAO-G在所有指标上均显著优于SOTA方法。 2. 对三种实际超导体(CsV₃Sb₅、Zr₁₆Rh₈O₄和Zr₁₆Pd₈O₄)进行了测试,结果表明DAO-G生成的结构接近实验值,DAO-P对临界温度T_c的预测高度准确。 3. 与传统DFT计算工具(如Quantum Espresso)相比,该方法不仅速度提升了1000倍以上,而且预测误差大幅降低。 4. 论文通过广泛的消融研究验证了DAO-P对DAO-G性能提升的重要性。 5. 尽管未明确提及代码开源,但其创新框架和实验设计为未来的研究提供了重要参考。
  • 相关研究
    近期相关研究包括: 1. 'Crystal Graph Neural Networks for Predicting Material Properties' - 利用图神经网络预测材料性质。 2. 'Deep Learning for Crystal Structure Prediction Using Pairwise Atomic Interactions' - 基于原子间相互作用的深度学习CSP方法。 3. 'Generative Models for Crystal Structure Discovery' - 探索生成模型在新材料发现中的应用。 4. 'Machine Learning Approaches to High-Throughput Screening of Materials' - 高通量材料筛选的机器学习方法。 这些研究大多关注于单一任务(如结构生成或性质预测),而本文提出的DAO框架将两者结合,形成了一个更加完整的解决方案。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论