• 作者



AI 工具 GNoME 发现了 220 万种新晶体,其中包括 38 万种可以为未来技术提供动力的稳定材料



从计算机芯片、电池到太阳能电池板的现代技术都依赖于无机晶体。为了实现新技术,晶体必须稳定,否则就会分解,而每个新的、稳定的晶体背后都可能需要数月的艰苦实验。



今天,在《自然》杂志上发表的一篇论文(https://www.nature.com/articles/s41586-023-06735-9)中,我们分享了 220 万颗新晶体的发现,相当于近 800 年的知识。我们推出了用于材料探索的图网络 (GNoME),这是我们新的深度学习工具,可通过预测新材料的稳定性来显着提高发现的速度和效率。


借助 GNoME,我们使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,有 38 万个是最稳定的,这使得它们成为实验合成的有希望的候选者。这些候选材料中有可能开发未来变革性技术,包括超导体、超级计算机供电和下一代电池,以提高电动汽车的效率。


GNoME 展示了利用人工智能大规模发现和开发新材料的潜力。世界各地实验室的外部研究人员在并行工作中独立实验创建了 736 个此类新结构。劳伦斯伯克利国家实验室的研究团队与 Google DeepMind 合作,还在《自然》杂志上发表了第二篇论文(https://www.nature.com/articles/s41586-023-06734-w),展示了如何利用我们的人工智能预测进行自主材料合成。


我们已将GNoME (https://www.nature.com/articles/s41586-023-06735-9)的预测提供给研究界。我们将向材料项目贡献 380,000 种预计稳定的材料,该项目目前正在处理这些化合物并将其添加到其在线数据库(https://next-gen.materialsproject.org/)中。我们希望这些资源能够推动无机晶体的研究,并释放机器学习工具作为实验指南的前景。


利用人工智能加速材料发现


ICSD 数据库中通过实验鉴定出的大约 20,000 个晶体在计算上是稳定的。来自材料项目、开放量子材料数据库和 WBM 数据库的计算方法将这一数量增加到 48,000 个稳定晶体。GNoME 将人类已知的稳定材料的数量扩大到 421,000 种。


过去,科学家通过调整已知晶体或试验新的元素组合来寻找新颖的晶体结构,这是一个昂贵的反复试验过程,可能需要数月时间才能获得有限的结果。在过去的十年中,材料项目(https://materialsproject.org/)和其他小组领导的计算方法已经帮助发现了 28,000 种新材料。但到目前为止,新的人工智能引导方法在准确预测实验上可行的材料方面遇到了根本限制。GNoME 发现的 220 万种材料相当于约 800 年的知识价值,并展示了前所未有的预测规模和准确度。


例如,52,000 种类似于石墨烯的新型层状化合物有可能随着超导体的发展而彻底改变电子学。此前,已鉴定出约1000种此类材料(https://pubmed.ncbi.nlm.nih.gov/28191965/)。我们还发现了 528 个潜在的锂离子导体,比之前的研究(https://pubs.rsc.org/en/content/articlelanding/2017/ee/c6ee02697d)多了 25 倍,可用于提高可充电电池的性能。


我们将发布 380,000 种材料的预测结构,这些材料最有可能在实验室中成功制造并用于可行的应用。对于被认为是稳定的材料,它必须不会分解成具有较低能量的类似成分。例如,与钻石中的碳相比,类石墨烯结构中的碳是稳定的。从数学上讲,这些材料位于凸包上。该项目发现了 220 万个新晶体,按照当前的科学标准,这些晶体是稳定的,并且位于先前发现的凸包之下。其中,380,000 被认为是最稳定的,位于“最终”凸包上——我们为材料稳定性设定的新标准。


GNoME:利用图网络进行材料探索


GNoME 使用两条管道来发现低能量(稳定)材料。结构管道创建结构与已知晶体相似的候选物,而成分管道则遵循基于化学式的更加随机的方法。使用已建立的密度泛函理论计算来评估两个管道的输出,并将这些结果添加到 GNoME 数据库中,为下一轮主动学习提供信息。


GNoME 是一种最先进的图神经网络 (GNN) 模型。GNN 的输入数据采用图表的形式,类似于原子之间的连接,这使得 GNN 特别适合发现新的晶体材料。


GNoME 最初接受了有关晶体结构及其稳定性的数据的训练,这些数据可通过Materials Project(https://next-gen.materialsproject.org/)公开获得。我们使用 GNoME 生成新型候选晶体,并预测它们的稳定性。为了评估我们的模型在渐进训练周期中的预测能力,我们使用称为密度泛函理论 (DFT) 的既定计算技术反复检查其性能,该技术用于物理、化学和材料科学,以了解原子结构,这对于评估稳定性非常重要晶体。


我们使用了一种称为“主动学习”的培训过程,极大地提高了 GNoME 的性能。GNoME 将为新型稳定晶体的结构生成预测,然后使用 DFT 进行测试。然后将所得的高质量训练数据反馈到我们的模型训练中。


我们的研究将材料稳定性预测的发现率从 50% 左右提高到 80% - 基于MatBench Discovery(https://matbench-discovery.materialsproject.org/)(由先前最先进模型设定的外部基准)。我们还通过将发现率从 10% 以下提高到 80% 以上,成功地提高了模型的效率 - 这种效率的提高可能会对每次发现所需的计算量产生重大影响。


人工智能新材料的“配方”


GNoME 项目旨在降低发现新材料的成本。外部研究人员在实验室独立创造了 736 种 GNoME 新材料,证明我们的模型对稳定晶体的预测准确反映了现实。我们已向研究界发布了新发现晶体的数据库。通过为科学家提供新候选材料的有前途“配方”的完整目录,我们希望这有助于他们测试并可能制造出最好的材料。


完成最新的发现工作后,我们搜索了科学文献,发现 736 项计算发现是由全球外部团队独立实现的。以上是从首个碱土类金刚石光学材料 (Li4MgGe2S7) 到潜在超导体 (Mo5GeB2) 的六个示例。


基于这些晶体的新技术的快速开发将取决于它们的制造能力。在我们伯克利实验室的合作者领导的一篇论文中,研究人员表明机器人实验室可以利用自动合成技术快速制造新材料。利用材料项目中的材料和 GNoME 对稳定性的见解,自主实验室创建了晶体结构的新配方,并成功合成了超过 41 种新材料,为人工智能驱动的材料合成开辟了新的可能性。


A-Lab,伯克利实验室的一个设施,人工智能指导机器人制造新材料。


新材料新技术


为了建设更加可持续的未来,我们需要新材料。GNoME 发现了 380,000 种稳定的晶体,它们具有开发绿色技术的潜力 - 从更好的电动汽车电池到更高效计算的超导体。


我们以及伯克利实验室、谷歌研究院和世界各地团队的合作者的研究表明了使用人工智能指导材料发现、实验和合成的潜力。我们希望 GNoME 与其他人工智能工具一起能够帮助彻底改变当今的材料发现并塑造该领域的未来。


微信群                   公众号

  

内容中包含的图片若涉及版权问题,请及时与我们联系删除