KAN-ODEs: Kolmogorov-Arnold Network Ordinary Differential Equations for Learning Dynamical Systems and Hidden Physics

2024年07月05日
  • 简介
    本文使用Kolmogorov-Arnold网络(KANs)作为多层感知器(MLPs)的替代品,展示了数据驱动建模的强大潜力。该工作将KANs作为神经常微分方程(Neural ODE)框架的支撑,将它们的使用推广到科学机器学习应用中经常出现的时间依赖和网格敏感情况。所提出的KAN-ODE保留了神经ODE的灵活动态系统建模框架,同时利用了KANs的许多优点,包括更快的神经缩放、更强的可解释性以及与MLPs相比更低的参数数量。我们在三个测试案例中展示了这些优点:Lotka-Volterra食饵-掠食者模型、Burgers方程和Fisher-KPP PDE。我们展示了参数精简的KAN-ODE系统在重建整个动态系统方面的强大性能,以及在推断已知流场中的源项方面的有针对性的应用。此外,我们还通过激活函数可视化和训练结果的符号回归展示了KAN-ODE的可解释性。成功训练KAN-ODE并与传统神经ODE的性能进行比较,意味着在利用这种新型网络结构进行各种科学机器学习应用方面具有重要潜力。
  • 图表
  • 解决问题
    本论文旨在将Kolmogorov-Arnold Networks(KANs)应用于神经常微分方程(Neural ODE)框架中,以解决科学机器学习应用中常见的时间依赖和网格敏感问题。同时,论文试图通过比较KANs和Multi-layer perceptrons(MLPs)的性能,证明KANs在可扩展性、可解释性和参数数量等方面的优势。
  • 关键思路
    论文的关键思路是将KANs与神经常微分方程相结合,形成KAN-ODEs模型,用于建模时间依赖和网格敏感问题。相比于传统的神经常微分方程模型,KAN-ODEs模型具有更快的神经扩展速度、更强的可解释性和更少的参数数量。
  • 其它亮点
    论文使用三个测试案例(Lotka-Volterra predator-prey model、Burgers' equation和Fisher-KPP PDE)证明了KAN-ODEs模型在重构整个动态系统和推断已知流场中的源项等方面的卓越性能。此外,论文还对KAN-ODEs模型进行了可解释性分析,包括激活函数可视化和符号回归等。值得注意的是,论文中使用的KAN-ODEs模型具有较少的参数数量,并且作者开源了代码。
  • 相关研究
    最近的相关研究包括:Neural ODEs、基于深度学习的科学计算、Kolmogorov-Arnold神经网络等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论