Minimum variance threshold for epsilon-lexicase selection

2024年04月08日
  • 简介
    父代选择在进化算法中扮演着重要的角色,存在许多策略来在繁殖下一代之前选择父代池。这些方法通常依赖于整个数据集上的平均误差作为选择父代的标准,这可能会由于所有测试用例的聚合而导致信息丢失。在 epsilon-lexicase 选择下,种群进入一个选择池,该选择池通过使用每个测试用例逐步减少,丢弃错误高于精英误差加上该特定测试用例的误差的中位数绝对偏差(MAD)的个体。为了更好地捕捉个体在用例上的性能差异,我们提出了一种将误差分为两个分区以最小化分区内总方差的新标准。我们的方法被嵌入到 FEAT 符号回归算法中,并使用 SRBench 框架进行评估,该框架包含 122 个黑盒合成和真实世界回归问题。实证结果表明,我们的方法在真实世界数据集上比传统的 epsilon-lexicase 选择表现更好,而在合成数据集上表现相当。
  • 图表
  • 解决问题
    本论文旨在解决进化算法中父代选择的问题,提出了一种新的标准来选择父代,以更好地捕捉个体在测试用例上的表现差异。
  • 关键思路
    论文提出的新标准将误差分成两个分区,最小化分区内的总方差,相比传统的epsilon-lexicase选择方法,能够更好地在真实数据集上表现。
  • 其它亮点
    论文将新的标准嵌入到FEAT符号回归算法中,并在SRBench框架下进行了122个黑盒合成和真实回归问题的实验。实验结果表明,相比传统的epsilon-lexicase选择方法,新方法在真实数据集上表现更好。
  • 相关研究
    近期的相关研究包括使用不同的选择方法来提高进化算法的性能,如Tournament选择和Rank选择等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论