Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

向作者提问

NEW

简介

设计能够保障行人风环境舒适性与安全性的城市空间，需依赖时间分辨的计算流体力学（CFD）仿真；然而，当前CFD仿真的计算开销过大，使得大规模的设计探索难以实现。为此，我们提出WinDiNet（风场扩散网络），一种经迁移训练的视频扩散模型，将其重新定位为面向该任务的快速、端到端可微分代理模型。本模型以参数量达20亿的潜空间视频变换器LTX-Video为基座，在10,000组针对程序化生成建筑布局开展的二维不可压缩CFD仿真数据上进行微调。通过系统性地比较不同训练范式、条件注入机制及变分自编码器（VAE）适配策略（包括引入物理信息引导的解码器损失函数），我们确定了一种性能优于专用神经偏微分方程（PDE）求解器的最优配置。最终模型可在不足一秒内生成完整的112帧风场演化序列。由于该代理模型具备端到端可微分特性，它同时可作为物理仿真器，支持基于梯度的逆向优化：给定城市地块轮廓，我们可直接通过反向传播优化建筑位置，从而同步提升风环境安全性与行人风舒适性。在单入口与多入口布局的实验中，该优化器即使在多目标协同优化等复杂场景下，仍能自主发现高效可行的布局方案；所有优化所得改进均经真实CFD仿真结果严格验证。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

城市风环境设计中，传统基于CFD的行人风舒适性与安全性评估计算成本过高，难以支持实时、大规模、可微分的设计探索与优化。该问题并非全新，但现有方法（如简化模型、代理模型、神经PDE求解器）在精度、速度与可微性三者间难以兼顾。
关键思路

将预训练的大规模视频生成模型（LTX-Video）迁移为物理感知的风场时序代理模型——WinDiNet：通过在10,000组程序化生成建筑布局对应的2D不可压CFD时序数据上微调，并引入物理信息驱动的VAE解码器损失、结构化条件输入（布局编码）和系统化训练策略，使模型兼具亚秒级生成（112帧<1s）、高保真度和端到端可微性，首次实现‘生成式AI模型’向‘可微物理仿真器’的可靠转化。
其它亮点

• 首个基于扩散架构、支持完整时序风场生成（非稳态）且完全可微的CFD代理模型；• 物理引导的解码器损失（如涡量守恒正则项）显著提升泛化性，超越专用神经PDE求解器（如Fourier Neural Operators）；• 实验涵盖单/双入口复杂流场，所有优化结果均经真实CFD验证；• 模型支持梯度驱动的逆向设计：直接对建筑坐标参数进行反向传播优化；• 数据集为自建、开源（论文声明代码与数据将公开于GitHub），含程序化布局生成器与CFD流水线。
相关研究

• 'Neural Operator: Graph Kernel Network for Partial Differential Equations' (Zongyi Li et al., ICLR 2021)；• 'FourCastNet: A Global Data-driven High-resolution Weather Model' (Pathak et al., Science 2022)；• 'PDE-Net 2.0: Learning PDEs from Data with a Numeric-Symbolic Hybrid Deep Network' (Long et al., JCP 2019)；• 'LTX-Video: Latent Tokenized Transformer for Text-to-Video Generation' (Chen et al., arXiv 2024)；• 'Wind Tunnel Meets AI: Surrogate Modeling for Urban Wind Flow Using Deep Learning' (Zhang et al., Building and Environment, 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问