欢迎阅读《基于物理学的深度学习》（v0.3，GenAI版）

简而言之：本文档是一份实用且全面的指南，旨在指导读者在物理模拟领域应用深度学习。我们强调实际应用而非仅仅讲解理论：每个概念都配有交互式 Jupyter Notebook，帮助您快速上手。除了传统的监督学习之外，我们还深入探讨了物理损失约束、可微模拟、基于扩散的概率生成式人工智能方法，以及强化学习和高级神经网络架构。这些基础知识正在为下一代科学基础模型铺平道路。我们正处于一个快速变革的时代。这些方法有可能重新定义计算科学的边界。

v0.3 版本新增内容：最新版本新增了关于生成建模的重要章节，涵盖了去噪、流匹配、自回归学习、物理集成约束和基于扩散的图网络等强大技术。此外，我们还专门新增了针对物理模拟设计的神经网络架构章节。所有代码示例均已更新，以利用最新的框架。

先给大家透露一下，接下来的章节将展现：

如何训练神经网络利用扩散模型预测翼型周围的流体流动。这提供了一种概率代理模型，该模型可以替代并优于传统的模拟器。

如何利用模型方程作为残差来训练代表解的网络，以及如何通过使用可微模拟来改进这些残差约束。

如何更紧密地与用于逆问题的完整模拟器进行交互。例如，我们将演示如何通过在训练循环中利用模拟器来规避标准强化学习技术的收敛问题。

我们还将讨论选择正确的网络架构的重要性：是否考虑全局交互或局部交互、连续表示或离散表示，以及结构化图网格与非结构化图网格。

本文将介绍将物理模型引入深度学习的不同方法，即基于物理的深度学习（PBDL）方法。我们将按照集成程度递增的顺序介绍这些算法变体，并讨论不同方法的优缺点。了解每种技术在哪些场景下特别有用至关重要。

书名：Physics-based Deep Learning

作者： N. Thuerey

年份：2026

下载地址：https://t.zsxq.com/7U2au

请索引第64本书籍

概述

本书名为《基于物理的深度学习》，其名称表明了物理建模和数值模拟与基于人工智能（即神经网络）的方法相结合的研究方向。基于物理的深度学习，也称为科学机器学习，代表着一个非常活跃、快速发展且令人兴奋的研究领域。下一章将对该主题进行更深入的介绍，并为后续章节奠定基础。

图 4了解我们的环境并预测其演变是人类面临的关键挑战之一。计算机模拟是实现这些目标的关键工具，而下一代模拟技术很可能受益于人工智能和深度学习组件的集成，从而能够对我们环境中的各种现象做出更准确的预测。

动机

从天气和气候预测[ Sto14 ]（见上图），到量子物理[ OMalleyBK+16 ]，再到等离子体聚变的控制[ MLA+19 ]，利用数值分析来获得物理模型的解决方案已成为科学不可或缺的一部分。

近年来，由深度神经网络驱动的人工智能在众多领域取得了令人瞩目的成就：从图像分类[ KSH12 ]、自然语言处理[ RWC+19 ]、蛋白质折叠[ Qur19 ]到各种基础模型，该领域充满活力，发展迅速，前景广阔。

取代传统模拟？

深度学习（DL）方法的这些成功案例引发了人们的担忧，即这项技术有可能取代传统的、以仿真为驱动的科学方法。例如，最近的研究表明，基于神经网络的代理模型能够达到现实世界工业应用（例如翼型流动）所需的精度[ CT22 ]，同时在运行时间方面比传统求解器快几个数量级。

与其依赖从基本原理精心构建的模型，能否通过处理足够大的数据集来获得正确答案？正如我们将在后续章节中展示的，这种担忧是没有根据的。相反，下一代仿真系统的关键在于弥合这两个领域的鸿沟：将经典数值技术与人工智能方法相结合。此外，后者在传统方法难以应对的领域，例如处理复杂分布和仿真中的不确定性，提供了令人兴奋的新可能性。

将深度学习与数值方法相结合之所以至关重要，一个核心原因在于：深度学习方法功能强大，但同时也能从物理模型形式的领域知识中获益匪浅。深度学习技术和神经网络都是新兴技术，有时难以应用，而且将我们对物理过程的理解恰当地融入学习算法也并非易事。

过去几十年间，人们开发了高度专业化且精确的离散化方案，用于求解诸如纳维-斯托克斯方程、麦克斯韦方程或薛定谔方程等基本模型方程。看似微不足道的离散化方案变化，却能决定关键现象是否能在解中显现。本书并非要摒弃数值数学领域中已发展出的强大方法，而是要阐明在应用深度学习时，尽可能地运用这些方法将大有裨益。

黑匣子？

过去，人工智能和深度学习方法常常将训练好的神经网络与黑箱联系起来，暗示它们超出了人类的理解范围。然而，这些观点通常源于道听途说和对“热门”话题的普遍怀疑。

这种情况在科学领域非常普遍：我们面对的是一类全新的方法，而“所有细节”尚未完全解决。这在各种科学进步中都相当常见。数值方法本身就是一个很好的例子。大约在1950年，数值近似和求解器处境艰难。例如，引用H. Goldstine的话来说，数值不稳定性被认为是“未来持续的焦虑来源” [ Gol90 ]。如今，我们对这些不稳定性有了相当深入的了解，数值方法也变得无处不在且成熟可靠。人工智能和神经网络也遵循着同样的人类进步之路。

因此，我们必须意识到，从某种意义上说，深度学习方法并没有什么特别之处，也并非超凡脱俗。它们只不过是一套新的数值工具。话虽如此，它们显然非常新颖，而且目前无疑是我们解决非线性问题的最强大工具。尽管所有细节尚未完全完善，相关文献也尚未详尽阐述，但这不应妨碍我们将这些强大的方法纳入我们的数值工具箱。

协调人工智能与模拟

退一步讲，本书的目标是充分利用我们现有的所有强大数值模拟技术，并尽可能地将它们与深度学习结合起来。因此，本书的核心目标是将人工智能的视角与物理模拟相协调。

本文件的目标

接下来我们将重点讨论以下几个方面：

如何使用深度学习技术解决偏微分方程问题，
如何将它们与现有的物理学知识结合起来，
在不摒弃数值方法的前提下。

与此同时，值得注意的是，我们不会涵盖以下内容：

本书没有对深度学习和数值模拟进行深入介绍（已有其他优秀著作对此进行了详细介绍），
其目的并非对该领域的研究文章进行广泛的调查。

由此产生的方法具有巨大的潜力，可以显著提升数值方法的性能：例如，在求解器反复求解特定定义明确问题域中的案例时，一次性投入大量资源训练一个支持重复求解的神经网络就显得非常有意义。大型“基础模型”的开发在这一领域尤其具有前景。基于特定领域的专精，通过对较小数据集进行微调，混合求解器有望大幅超越传统的通用求解器。尽管仍存在诸多未解之谜，但初步研究已表明，这一目标是切实可行的[ KSA+21 , UBH+20 ]。

换个角度来看，我们自然界的所有数学模型都是理想化的近似值，都包含误差。人们已经付出了很多努力来获得非常好的模型方程，但为了取得下一个重大进展，人工智能和深度学习方法提供了一种非常强大的工具，可以弥合与现实之间的剩余差距[ AAC+19 ]。

分类

在基于物理的深度学习领域，我们可以区分出各种不同的方法，例如，针对约束条件、组合方法、优化和应用。更具体地说，所有方法要么针对正向模拟（预测状态或时间演化），要么针对逆 问题（例如，从观测中获得物理系统的参数化或状态）。

无论我们考虑的是正问题还是逆问题，以下主题最关键的区别在于深度学习技术与领域知识的融合方式，通常以偏微分方程（PDE）的形式构建模型方程。我们可以将基于物理的深度学习（PBDL）技术大致分为以下三类：

监督式学习：数据由物理系统（真实或模拟）产生，但不存在进一步的交互。这是经典的机器学习方法。
损失项：物理动力学（或其部分）被编码在损失函数中，通常以可微运算的形式呈现。学习过程可以反复评估损失，并且通常从基于偏微分方程的公式中接收梯度。这些软约束有时也被称为“物理信息”训练。
混合方法：将完整的物理仿真与深度神经网络的输出交错结合；这通常需要一个完全可微的仿真器。它代表了物理系统与学习过程之间最紧密的耦合，并产生一个结合了传统技术和基于人工智能技术的混合求解器。

因此，可以根据正向求解与反向求解以及物理模型与神经网络的集成程度对方法进行分类。其中，利用可微物理的混合方法尤其能够实现深度学习和数值模拟方法的紧密集成。

命名

值得指出的是，我们在下文中称之为“可微物理学”的概念，在其他资源和研究论文中以各种不同的名称出现。之所以称之为“可微物理学”，是受到了深度学习中可微编程范式的启发。例如，深度学习中还有“可微渲染方法”，它致力于模拟光线如何形成我们人类所看到的图像。与此不同的是，从现在开始，我们将专注于物理模拟，因此采用了这个名称。

然而，在其他领域，人们更常用其他名称。例如，可微物理方法等价于使用伴随方法并将其与深度学习程序相结合。实际上，它也等价于将反向传播/反向模式微分应用于数值模拟。但是，如上所述，出于深度学习的视角，我们将从现在开始把所有这些方法统称为“可微物理”方法。

将深度学习与传统求解器相结合而产生的混合求解器也可以被视为一个经典课题：在这种情况下，神经网络的任务是修正求解器。这种修正可以针对数值误差，也可以针对方程中未解析的项。这是一个科学中的基础问题，曾以各种名称被提出，例如流体动力学和湍流中的封闭问题、材料科学中的均质化或粗粒化问题，以及气候和天气模拟中的参数化问题。不同领域对这一目标的重新阐释凸显了其根本问题的重要性，本文将阐述深度学习为解决这一问题提供的新方法。