LLM-SR: Scientific Equation Discovery via Programming with Large Language Models

2024年04月29日
  • 简介
    数学方程在各个科学领域中描述复杂自然现象时具有不合理的效果。然而,从数据中发现这样有洞察力的方程式存在着重大挑战,因为必须在极高维的组合和非线性假设空间中进行导航。传统的方程式发现方法主要集中于从数据中提取方程式,往往忽略了科学家通常依赖的丰富领域特定先验知识。为了弥合这一差距,我们介绍了LLM-SR,一种新颖的方法,它利用大型语言模型(LLMs)的广泛科学知识和强大的代码生成能力,以高效的方式从数据中发现科学方程。具体而言,LLM-SR将方程式视为带有数学运算符的程序,并将LLMs的科学先验知识与方程式程序上的进化搜索相结合。LLM迭代地提出新的方程式框架,从其物理理解中提取,然后针对数据进行优化以估计框架参数。我们在三个不同的科学领域展示了LLM-SR的有效性,它发现了物理上准确的方程式,与已建立的方程式发现基线相比,提供了更好的拟合于领域内和领域外的数据。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在解决从数据中发现科学方程的问题,同时结合领域特定先验知识,提出了一种新的方法。
  • 关键思路
    本文提出了一种新的方法LLM-SR,将方程视为具有数学运算符的程序,并将LLMs的科学先验知识与方程程序的进化搜索相结合,从而有效地从数据中发现科学方程。
  • 其它亮点
    本文的实验结果表明,LLM-SR在三个不同的科学领域中都表现出了显著的优越性,发现了物理上准确的方程,并提供了比现有的方程发现基线更好的拟合效果。本文还介绍了LLM-SR的代码和数据集。
  • 相关研究
    在相关研究方面,最近的研究包括使用深度学习方法发现方程,以及利用符号回归方法从数据中发现方程。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问