DRUGONE

过量吉布斯自由能是描述液体混合物热力学性质的核心物理量,是计算活度系数以及相平衡行为的基础。然而,仅从分子结构出发准确预测该量,一直是热力学与化学工程中的长期挑战。


研究人员提出了一种名为HANNA的机器学习模型,通过在模型结构中嵌入严格的物理约束,实现对过量吉布斯自由能的热力学一致预测。该模型在蒸汽–液体平衡、液–液平衡、无限稀释活度系数以及过量焓等多种实验数据上进行端到端训练,并通过几何投影方法扩展至多组分体系。结果表明,HANNA在预测精度和适用范围上均优于当前主流方法,同时能够在完全未知体系上进行可靠预测。这一工作展示了将物理规律与机器学习深度融合的新方向。

在化学工程和物理化学中,液体混合物的热力学性质对于反应设计、分离过程以及材料开发至关重要。其中,过量吉布斯自由能作为核心量,可以通过一系列热力学关系推导出活度系数,而后者直接决定相平衡行为,包括蒸汽–液体平衡、液–液分离以及化学反应平衡。


然而,该物理量无法直接测量,必须通过实验间接推断,而相关实验成本高、覆盖范围有限。面对成千上万种组分及其组合,绝大多数体系无法通过实验完全探索,这使得建立可靠的预测模型成为关键任务。


传统方法主要基于成对相互作用的思想,例如NRTL和UNIQUAC模型,通过拟合实验数据获得参数。这类方法在已知体系中表现良好,但难以推广至未知组分或缺乏数据的体系。


为提升泛化能力,研究人员提出了基于基团贡献的方法,如UNIFAC,通过将分子拆分为结构基团进行建模。然而,这类方法依赖预定义的基团体系,对于新型分子或复杂体系存在明显局限。


近年来,机器学习方法开始应用于该领域,部分模型通过预测传统模型参数进行改进,另一些则直接预测活度系数。然而,这些方法通常缺乏严格的热力学一致性约束,容易产生物理上不合理的结果。


因此,一个核心问题逐渐浮现:如何构建既具备机器学习灵活性,又严格遵循热力学定律的模型。



方法


研究人员提出的HANNA模型从根本上改变了建模方式。该方法不再依赖传统热力学模型方程,而是将热力学一致性直接嵌入神经网络结构中,作为“硬约束”加以保证。


模型以分子的SMILES表示为输入,通过预训练的分子语言模型生成分子嵌入,并结合温度和组成信息预测过量吉布斯自由能。随后,通过自动微分直接得到活度系数,从而保证与热力学基本关系严格一致。


在训练过程中,研究人员整合了多种实验数据,包括蒸汽–液体平衡、液–液平衡、无限稀释活度系数以及过量焓数据。其中,针对液–液平衡数据,设计了替代求解器以避免复杂的非线性求解过程,并引入基于稳定性判据的损失函数,使模型能够正确识别相分离行为。


此外,模型采用几何投影方法,将二元体系信息扩展到多组分体系,从而在仅使用二元数据训练的情况下实现对复杂体系的预测。

图1. HANNA模型框架与训练流程。



结果


研究人员首先展示了HANNA的整体结构。从分子结构输入到过量吉布斯自由能预测,再到活度系数与相平衡计算,整个流程形成了一个端到端、物理一致的建模框架。



在二元体系中全面超越UNIFAC

在标准基准测试中,研究人员将HANNA与工业界广泛使用的UNIFAC模型进行比较。结果表明,在蒸汽–液体平衡、无限稀释活度系数以及液–液平衡等多个指标上,HANNA均表现出更高精度。


尤其是在无限稀释条件下,误差显著降低,表明模型能够更好地捕捉强非理想体系的行为。此外,在识别液–液相分离方面,HANNA的准确率明显高于传统模型。


值得注意的是,即使在传统模型无法覆盖的体系中(如含离子液体体系),HANNA仍然能够进行有效预测。

图2. 二元体系性能对比。



能够统一描述多种相平衡行为

研究人员进一步分析了模型在不同类型相图中的表现。结果显示,HANNA能够同时准确描述近理想体系、强正偏差体系以及强负偏差体系的蒸汽–液体平衡行为。


同时,在液–液平衡预测中,模型不仅能够识别常见的相分离,还能预测复杂相行为,例如具有上下临界溶解温度的“岛状相图”。这些能力表明模型具备较强的物理泛化能力。



成功推广至多组分体系

在三元体系测试中,研究人员发现HANNA在大多数情况下仍保持与二元体系相当的预测精度,尤其是在蒸汽–液体平衡和液–液平衡任务中表现稳定。


虽然在部分无限稀释预测中精度略有下降,但整体性能仍优于或接近传统模型。特别是在识别多组分体系中的相分离行为方面,HANNA表现出更高的准确率。


进一步分析表明,其几何投影方法在多组分扩展中具有良好效果。

图3. 多组分体系预测性能。



优于现有机器学习模型

研究人员将HANNA与多种基于图神经网络的模型进行比较。结果显示,在几乎所有评估指标上,HANNA均取得更低误差,同时适用范围更广。


相比其他方法仅适用于特定温度或体系,HANNA能够处理更复杂的条件,并保持热力学一致性,这是其重要优势。



讨论


该研究提出的HANNA模型展示了一种新的科学建模范式,即在机器学习模型中直接嵌入物理定律,从而实现“可解释性”与“高性能”的统一。


与传统模型相比,HANNA无需人工定义分子相互作用形式,也不依赖有限的基团划分体系,而是直接从分子结构学习复杂相互作用,同时保证所有预测满足热力学基本约束。


其成功关键在于多个方面的协同设计,包括硬约束网络结构、多数据源联合训练、替代求解器以及几何投影策略。这些设计使模型不仅具有高精度,还具备良好的泛化能力。


尽管如此,该方法仍存在一定局限,例如对极端温度范围和高压条件的适用性尚未充分验证,同时对离子体系的显式建模仍有待扩展。


总体而言,这项工作标志着机器学习在热力学建模中的重要进展,为复杂混合物性质预测提供了一种强有力的新工具,并有望在化工过程设计与新材料开发中发挥重要作用。

整理 | DrugOne团队


参考资料


Hoffmann, M., Specht, T., Göttl, Q. et al. Thermodynamically consistent machine learning model for excess Gibbs energy. Nat Commun 17, 3485 (2026). 

https://doi.org/10.1038/s41467-026-71430-y

内容为【DrugOne】公众号原创转载请注明来源

内容中包含的图片若涉及版权问题,请及时与我们联系删除