使用PySR和SymbolicRegression.jl进行可解释的机器学习在科学中的应用

Interpretable Machine Learning for Science with PySR and SymbolicRegression.jl

解决问题：

这篇论文旨在解决一种名为符号回归的机器学习方法的实用性问题，该方法旨在发现人类可解释的符号模型。同时，论文介绍了一个新的基准测试EmpiricalBench，以评估符号回归算法在科学中的适用性。

关键思路：

论文介绍了一个名为PySR的开源库，用于实现符号回归，并介绍了其内部搜索算法-多种群进化算法，以及基于Julia的SymbolicRegression.jl库。相比于当前领域的研究，该论文的新意在于提供了一种高性能的符号回归实现，可以自动融合用户定义的操作符，并在集群上分布式运行。

其他亮点：

该论文提出的EmpiricalBench基准测试可以用于衡量符号回归算法在恢复历史经验公式方面的性能。该论文还介绍了与深度学习软件的接口，并提供了开源代码。

关于作者：

Miles Cranmer是该论文的主要作者，他是普林斯顿大学计算机科学系的博士后研究员。他以前的代表作包括“Learning Physical Intuition of Block Towers by Example”和“Discovering Symbolic Models from Deep Learning with Inductive Biases”。

地址：https://github.com/MilesCranmer

论文摘要：

PySR是一个开源库，用于实际符号回归，这是一种旨在发现人类可解释符号模型的机器学习方法。PySR的开发旨在使符号回归在科学领域民主化和普及化，它建立在高性能分布式后端、灵活的搜索算法和与几个深度学习包的接口上。PySR的内部搜索算法是一个多种群进化算法，由一个独特的进化-简化-优化循环组成，旨在优化新发现的经验表达式中的未知标量常数。PySR的后端是极其优化的Julia库SymbolicRegression.jl，可以直接从Julia中使用。它能够在运行时将用户定义的运算符融合到SIMD内核中，执行自动微分，并将表达式的种群分配到集群中的数千个核心。在描述这个软件的同时，我们还介绍了一个新的基准测试“EmpiricalBench”，用于量化符号回归算法在科学中的适用性。这个基准测试衡量了从原始和合成数据集中恢复历史经验方程的能力。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

使用PySR和SymbolicRegression.jl进行可解释的机器学习在科学中的应用

评论列表

评论