LLM-SR: Scientific Equation Discovery via Programming with Large Language Models

简介

数学方程在各个科学领域中描述复杂自然现象时具有不合理的效果。然而，从数据中发现这样有洞察力的方程式存在着重大挑战，因为必须在极高维的组合和非线性假设空间中进行导航。传统的方程式发现方法主要集中于从数据中提取方程式，往往忽略了科学家通常依赖的丰富领域特定先验知识。为了弥合这一差距，我们介绍了LLM-SR，一种新颖的方法，它利用大型语言模型(LLMs)的广泛科学知识和强大的代码生成能力，以高效的方式从数据中发现科学方程。具体而言，LLM-SR将方程式视为带有数学运算符的程序，并将LLMs的科学先验知识与方程式程序上的进化搜索相结合。LLM迭代地提出新的方程式框架，从其物理理解中提取，然后针对数据进行优化以估计框架参数。我们在三个不同的科学领域展示了LLM-SR的有效性，它发现了物理上准确的方程式，与已建立的方程式发现基线相比，提供了更好的拟合于领域内和领域外的数据。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在解决从数据中发现科学方程的问题，同时结合领域特定先验知识，提出了一种新的方法。
关键思路

本文提出了一种新的方法LLM-SR，将方程视为具有数学运算符的程序，并将LLMs的科学先验知识与方程程序的进化搜索相结合，从而有效地从数据中发现科学方程。
其它亮点

本文的实验结果表明，LLM-SR在三个不同的科学领域中都表现出了显著的优越性，发现了物理上准确的方程，并提供了比现有的方程发现基线更好的拟合效果。本文还介绍了LLM-SR的代码和数据集。
相关研究

在相关研究方面，最近的研究包括使用深度学习方法发现方程，以及利用符号回归方法从数据中发现方程。

LLM-SR: Scientific Equation Discovery via Programming with Large Language Models

提问交流

提问交流