- 简介深度神经网络(DNNs)通过从大规模数据集中学习复杂的非线性映射,已经在各个领域取得了卓越的性能。然而,它们面临着高计算成本和有限的可解释性等挑战。为了解决这些问题,将物理与人工智能相结合的混合方法引起了人们的兴趣。本文介绍了一种新颖的基于物理的人工智能模型,称为“非线性薛定谔网络”,它将非线性薛定谔方程(NLSE)作为通用可训练模型,用于从数据中学习复杂的模式,包括非线性映射和记忆效应。现有的物理信息机器学习方法使用神经网络来近似偏微分方程(PDE)的解。相比之下,我们的方法直接将PDE作为可训练模型来获得一般非线性映射,否则需要神经网络。作为物理和人工智能的一种共生方式,它提供了比传统的黑盒神经网络更可解释和参数高效的替代方案,在某些时间序列分类任务中实现了可比或更好的精度,同时显著减少了所需的参数数量。值得注意的是,训练后的非线性薛定谔网络是可解释的,所有参数都具有物理意义,作为将数据转换为更可分离空间的虚拟物理系统的属性。这种可解释性允许深入了解数据转换过程的基本动态。还探讨了时间序列预测的应用。虽然我们目前的实现利用了NLSE,但使用物理方程作为可训练模型从数据中学习非线性映射的建议方法并不限于NLSE,可以扩展到其他物理主方程。
- 图表
- 解决问题论文提出了一种名为“Nonlinear Schrödinger Network”的物理学-AI混合模型,旨在解决深度神经网络的高计算成本和有限的可解释性问题。
- 关键思路该模型将非线性薛定谔方程视为一种通用可训练模型,直接将偏微分方程视为可训练模型,以获取从数据中学习复杂模式的非线性映射,从而提供更可解释和参数高效的替代方案。
- 其它亮点该模型在一些时间序列分类任务中实现了与传统黑盒神经网络相当甚至更好的准确性,同时显著减少了所需的参数数量。该模型可解释性强,所有参数都具有物理意义。该方法不仅限于非线性薛定谔方程,可扩展到其他物理主方程。
- 最近的物理学-AI混合模型研究集中在使用神经网络逼近偏微分方程的解决方案上,而该论文的方法则直接将偏微分方程视为可训练模型,以获取非线性映射。相关论文包括“Physics-Informed Machine Learning: An Introduction with Application to Surrogate Modeling”和“Deep Learning for Universal Linear Embeddings of Nonlinear Dynamics”。
沙发等你来抢
去评论
评论
沙发等你来抢