Nat. Commun. | 兼顾物理规律的AI建模：热力学一致的过量吉布斯自由能预测方法

DRUGONE

过量吉布斯自由能是描述液体混合物热力学性质的核心物理量，是计算活度系数以及相平衡行为的基础。然而，仅从分子结构出发准确预测该量，一直是热力学与化学工程中的长期挑战。

研究人员提出了一种名为HANNA的机器学习模型，通过在模型结构中嵌入严格的物理约束，实现对过量吉布斯自由能的热力学一致预测。该模型在蒸汽–液体平衡、液–液平衡、无限稀释活度系数以及过量焓等多种实验数据上进行端到端训练，并通过几何投影方法扩展至多组分体系。结果表明，HANNA在预测精度和适用范围上均优于当前主流方法，同时能够在完全未知体系上进行可靠预测。这一工作展示了将物理规律与机器学习深度融合的新方向。

在化学工程和物理化学中，液体混合物的热力学性质对于反应设计、分离过程以及材料开发至关重要。其中，过量吉布斯自由能作为核心量，可以通过一系列热力学关系推导出活度系数，而后者直接决定相平衡行为，包括蒸汽–液体平衡、液–液分离以及化学反应平衡。

然而，该物理量无法直接测量，必须通过实验间接推断，而相关实验成本高、覆盖范围有限。面对成千上万种组分及其组合，绝大多数体系无法通过实验完全探索，这使得建立可靠的预测模型成为关键任务。

传统方法主要基于成对相互作用的思想，例如NRTL和UNIQUAC模型，通过拟合实验数据获得参数。这类方法在已知体系中表现良好，但难以推广至未知组分或缺乏数据的体系。

为提升泛化能力，研究人员提出了基于基团贡献的方法，如UNIFAC，通过将分子拆分为结构基团进行建模。然而，这类方法依赖预定义的基团体系，对于新型分子或复杂体系存在明显局限。

近年来，机器学习方法开始应用于该领域，部分模型通过预测传统模型参数进行改进，另一些则直接预测活度系数。然而，这些方法通常缺乏严格的热力学一致性约束，容易产生物理上不合理的结果。

因此，一个核心问题逐渐浮现：如何构建既具备机器学习灵活性，又严格遵循热力学定律的模型。

方法

研究人员提出的HANNA模型从根本上改变了建模方式。该方法不再依赖传统热力学模型方程，而是将热力学一致性直接嵌入神经网络结构中，作为“硬约束”加以保证。

模型以分子的SMILES表示为输入，通过预训练的分子语言模型生成分子嵌入，并结合温度和组成信息预测过量吉布斯自由能。随后，通过自动微分直接得到活度系数，从而保证与热力学基本关系严格一致。

在训练过程中，研究人员整合了多种实验数据，包括蒸汽–液体平衡、液–液平衡、无限稀释活度系数以及过量焓数据。其中，针对液–液平衡数据，设计了替代求解器以避免复杂的非线性求解过程，并引入基于稳定性判据的损失函数，使模型能够正确识别相分离行为。

此外，模型采用几何投影方法，将二元体系信息扩展到多组分体系，从而在仅使用二元数据训练的情况下实现对复杂体系的预测。

图1. HANNA模型框架与训练流程。

结果

研究人员首先展示了HANNA的整体结构。从分子结构输入到过量吉布斯自由能预测，再到活度系数与相平衡计算，整个流程形成了一个端到端、物理一致的建模框架。

在二元体系中全面超越UNIFAC

在标准基准测试中，研究人员将HANNA与工业界广泛使用的UNIFAC模型进行比较。结果表明，在蒸汽–液体平衡、无限稀释活度系数以及液–液平衡等多个指标上，HANNA均表现出更高精度。

尤其是在无限稀释条件下，误差显著降低，表明模型能够更好地捕捉强非理想体系的行为。此外，在识别液–液相分离方面，HANNA的准确率明显高于传统模型。

值得注意的是，即使在传统模型无法覆盖的体系中（如含离子液体体系），HANNA仍然能够进行有效预测。

图2. 二元体系性能对比。

能够统一描述多种相平衡行为

研究人员进一步分析了模型在不同类型相图中的表现。结果显示，HANNA能够同时准确描述近理想体系、强正偏差体系以及强负偏差体系的蒸汽–液体平衡行为。

同时，在液–液平衡预测中，模型不仅能够识别常见的相分离，还能预测复杂相行为，例如具有上下临界溶解温度的“岛状相图”。这些能力表明模型具备较强的物理泛化能力。

成功推广至多组分体系

在三元体系测试中，研究人员发现HANNA在大多数情况下仍保持与二元体系相当的预测精度，尤其是在蒸汽–液体平衡和液–液平衡任务中表现稳定。

虽然在部分无限稀释预测中精度略有下降，但整体性能仍优于或接近传统模型。特别是在识别多组分体系中的相分离行为方面，HANNA表现出更高的准确率。

进一步分析表明，其几何投影方法在多组分扩展中具有良好效果。

图3. 多组分体系预测性能。

优于现有机器学习模型

研究人员将HANNA与多种基于图神经网络的模型进行比较。结果显示，在几乎所有评估指标上，HANNA均取得更低误差，同时适用范围更广。

相比其他方法仅适用于特定温度或体系，HANNA能够处理更复杂的条件，并保持热力学一致性，这是其重要优势。

讨论

该研究提出的HANNA模型展示了一种新的科学建模范式，即在机器学习模型中直接嵌入物理定律，从而实现“可解释性”与“高性能”的统一。

与传统模型相比，HANNA无需人工定义分子相互作用形式，也不依赖有限的基团划分体系，而是直接从分子结构学习复杂相互作用，同时保证所有预测满足热力学基本约束。

其成功关键在于多个方面的协同设计，包括硬约束网络结构、多数据源联合训练、替代求解器以及几何投影策略。这些设计使模型不仅具有高精度，还具备良好的泛化能力。

尽管如此，该方法仍存在一定局限，例如对极端温度范围和高压条件的适用性尚未充分验证，同时对离子体系的显式建模仍有待扩展。

总体而言，这项工作标志着机器学习在热力学建模中的重要进展，为复杂混合物性质预测提供了一种强有力的新工具，并有望在化工过程设计与新材料开发中发挥重要作用。

整理 | DrugOne团队

参考资料

Hoffmann, M., Specht, T., Göttl, Q. et al. Thermodynamically consistent machine learning model for excess Gibbs energy. Nat Commun 17, 3485 (2026).

https://doi.org/10.1038/s41467-026-71430-y

内容为【DrugOne】公众号原创｜转载请注明来源

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Nat. Commun. | 兼顾物理规律的AI建模：热力学一致的过量吉布斯自由能预测方法

评论列表

评论