Information theory unifies atomistic machine learning, uncertainty quantification, and materials thermodynamics

向作者提问

NEW

简介

这段摘要讲述了在原子尺度建模中，精确描述信息对于许多问题都是相关的，例如采样方法、检测罕见事件、分析数据集或在机器学习驱动的模拟中执行不确定性量化（UQ）。虽然已经为每个任务提出了各自的方法，但它们缺乏一个共同的理论背景来整合它们的解决方案。作者在这里引入了一个信息理论框架，将相变、动力学事件、数据集优化和无模型UQ的预测统一起来，从而桥接了材料建模、机器学习和统计力学。作者首先证明了，对于提出的表示方法，原子中心环境的分布的信息熵是热力学熵的代理值。通过分子动力学（MD）模拟，作者展示了信息熵与轨迹的差异可用于构建相图、识别罕见事件和恢复经典的成核理论。在此基础上，作者使用熵的这个通用概念来量化MLIP数据集中的信息，从而指导压缩、解释测试误差的趋势和评估主动学习策略的效率。最后，作者提出了一种使用信息熵的无模型UQ方法，用于MLIP，显示它可靠地检测外推区域，可扩展到数百万个原子，并超越模型误差。这种方法作为QUESTS软件包提供，为数据驱动的原子尺度建模提供了一个新的统一理论，并结合了机器学习、第一原理热力学和模拟的努力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在提出一种信息理论框架，将原子模拟、机器学习和统计力学相结合，从而统一预测相变、动力学事件、数据集优化和无模型UQ等领域的问题。
关键思路

本文提出的信息熵概念可作为热力学熵的代理值，可用于构建相图、识别稀有事件、量化数据集信息、评估IPs的效率等。同时，作者还提出了一种基于信息熵的无模型UQ方法，能够可靠地检测外推区域。
其它亮点

本文提出的信息理论框架为数据驱动的原子模拟提供了一种新的统一理论，为机器学习、第一原理热力学和模拟等领域的研究提供了新思路。作者使用分子动力学模拟和机器学习方法进行实验，提出的方法具有可行性和实用性，作者还提供了开源代码。
相关研究

在相关研究方面，最近的一些研究包括：1. 用于原子模拟的机器学习方法的发展；2. 基于熵的方法在材料科学中的应用；3. 无模型UQ方法的发展等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问