Discovering symbolic expressions with parallelized tree search

2024年07月05日
  • 简介
    符号回归在现代科学研究中发挥着至关重要的作用,因为它能够从数据中发现简明易懂的数学表达式。一个重要的挑战在于在无限的搜索空间中寻找简洁且具有普适性的数学公式,同时意图拟合训练数据。在处理复杂问题时,现有算法面临着精度和效率方面的瓶颈,这实际上阻碍了符号回归在跨学科领域中进行科学探索的步伐。为此,我们引入了一种并行化树搜索(PTS)模型,以有效地从有限数据中提取通用的数学表达式。通过一系列广泛的实验,我们展示了PTS在方程式发现方面的卓越精度和效率,它在80多个合成和实验数据集上远远优于现有的基准模型(例如,精度提高了99%,速度提高了一个数量级)。PTS代表了精确和高效的数据驱动符号可解释模型(例如,潜在的物理定律)的重要进展,并标志着可扩展符号学习的关键转变。
  • 图表
  • 解决问题
    论文旨在解决符号回归中的准确性和效率瓶颈,即如何从有限的数据中高效地提取通用的数学表达式。
  • 关键思路
    论文提出了一种并行化树搜索(PTS)模型,通过在无限的搜索空间中寻找简洁通用的数学公式,从而高效地发现符号回归中的模型。
  • 其它亮点
    论文通过对80多个合成和实验数据集的广泛实验,证明了PTS在方程发现方面的卓越准确性和效率,并在速度和准确性上超过了现有的基线模型。该模型的实现具有可扩展性,可用于科学探索的各个领域。
  • 相关研究
    最近在符号回归领域的相关研究包括:1.《Genetic Programming Theory and Practice XV》;2.《A Survey of Symbolic Regression》;3.《Eureqa: A New Tool for Automated Data Analysis》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论