Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

2026年03月22日
  • 简介
    设计能够保障行人风环境舒适性与安全性的城市空间,需依赖时间分辨的计算流体力学(CFD)仿真;然而,当前CFD仿真的计算开销过大,使得大规模的设计探索难以实现。为此,我们提出WinDiNet(风场扩散网络),一种经迁移训练的视频扩散模型,将其重新定位为面向该任务的快速、端到端可微分代理模型。本模型以参数量达20亿的潜空间视频变换器LTX-Video为基座,在10,000组针对程序化生成建筑布局开展的二维不可压缩CFD仿真数据上进行微调。通过系统性地比较不同训练范式、条件注入机制及变分自编码器(VAE)适配策略(包括引入物理信息引导的解码器损失函数),我们确定了一种性能优于专用神经偏微分方程(PDE)求解器的最优配置。最终模型可在不足一秒内生成完整的112帧风场演化序列。由于该代理模型具备端到端可微分特性,它同时可作为物理仿真器,支持基于梯度的逆向优化:给定城市地块轮廓,我们可直接通过反向传播优化建筑位置,从而同步提升风环境安全性与行人风舒适性。在单入口与多入口布局的实验中,该优化器即使在多目标协同优化等复杂场景下,仍能自主发现高效可行的布局方案;所有优化所得改进均经真实CFD仿真结果严格验证。
  • 作者讲解
  • 图表
  • 解决问题
    城市风环境设计中,传统基于CFD的行人风舒适性与安全性评估计算成本过高,难以支持实时、大规模、可微分的设计探索与优化。该问题并非全新,但现有方法(如简化模型、代理模型、神经PDE求解器)在精度、速度与可微性三者间难以兼顾。
  • 关键思路
    将预训练的大规模视频生成模型(LTX-Video)迁移为物理感知的风场时序代理模型——WinDiNet:通过在10,000组程序化生成建筑布局对应的2D不可压CFD时序数据上微调,并引入物理信息驱动的VAE解码器损失、结构化条件输入(布局编码)和系统化训练策略,使模型兼具亚秒级生成(112帧<1s)、高保真度和端到端可微性,首次实现‘生成式AI模型’向‘可微物理仿真器’的可靠转化。
  • 其它亮点
    • 首个基于扩散架构、支持完整时序风场生成(非稳态)且完全可微的CFD代理模型;• 物理引导的解码器损失(如涡量守恒正则项)显著提升泛化性,超越专用神经PDE求解器(如Fourier Neural Operators);• 实验涵盖单/双入口复杂流场,所有优化结果均经真实CFD验证;• 模型支持梯度驱动的逆向设计:直接对建筑坐标参数进行反向传播优化;• 数据集为自建、开源(论文声明代码与数据将公开于GitHub),含程序化布局生成器与CFD流水线。
  • 相关研究
    • 'Neural Operator: Graph Kernel Network for Partial Differential Equations' (Zongyi Li et al., ICLR 2021);• 'FourCastNet: A Global Data-driven High-resolution Weather Model' (Pathak et al., Science 2022);• 'PDE-Net 2.0: Learning PDEs from Data with a Numeric-Symbolic Hybrid Deep Network' (Long et al., JCP 2019);• 'LTX-Video: Latent Tokenized Transformer for Text-to-Video Generation' (Chen et al., arXiv 2024);• 'Wind Tunnel Meets AI: Surrogate Modeling for Urban Wind Flow Using Deep Learning' (Zhang et al., Building and Environment, 2023)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问