Bridging Spherical Black-Box Optimizers

向作者提问

NEW

简介

当梯度信息不可获取时，黑箱优化（BBO）方法提供了一种实用的替代方案。尽管演化策略（ES）、基于共识的优化（CBO）、通过积分进行优化（OVI）及相关方法各自已被独立研究，但它们之间的内在联系仍鲜有探讨。我们将其统一纳入一个共同的理论框架之中，揭示出这些方法的核心差异主要体现在两个设计选择上：一是适应度聚合方式（决定对平坦极小值的偏好程度），二是共识作用范围（决定对多模态解空间的处理能力）。基于上述洞见，我们提出了若干混合型优化器，可在现有方法之间实现平滑插值与灵活切换。其中，我们的ES-OVI混合优化器支持显式调控对平坦极小值的偏好，从而在连续控制任务中实现性能与鲁棒性之间的可控权衡；而我们的CBO-OVI混合优化器则融合了参数化方法在高维空间中的高效性与基于粒子方法的多模态寻优能力，在评估资源受限的语言模型融合任务中取得了具有竞争力的结果。我们在标准黑箱优化基准测试及更高维度的运动控制任务上对所提方法进行了验证，结果表明，这些混合优化器的性能可超越其各自的组成算法。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

当梯度不可用时，黑箱优化（BBO）方法面临统一性不足的问题：现有主流方法（如进化策略ES、共识优化CBO、积分优化OVI等）虽各自有效，但缺乏理论统一框架，导致设计选择（如如何聚合适应度、如何定义共识）的动机模糊，难以系统理解其行为差异与互补性。本文旨在建立一个统一的理论框架，揭示这些方法的本质共性与关键分歧，并基于此构建可解释、可调控的混合优化器。这不是全新问题，但此前尚未有工作从‘fitness aggregation’与‘consensus scope’双轴视角进行系统解耦与整合。
关键思路

提出双因素统一框架：所有主流无梯度优化器均可建模为在概率流形上执行的随机动力系统，其核心差异仅由两个正交设计维度决定——（1）fitness aggregation（如指数加权vs.线性平均），控制对平坦极小值（flat minima）的偏好程度；（2）consensus scope（如全局均值vs.局部核加权），控制算法对单峰/多峰解结构的响应能力。基于此，首次实现ES-OVI（调控flatness鲁棒性）与CBO-OVI（融合高维效率与多模态搜索）的可控插值设计，使优化器行为可解释、可调节。
其它亮点

实验覆盖三类场景：（1）标准BBO基准（Sphere, Rastrigin, Cigar等，d=10–100）；（2）高维连续控制任务（MuJoCo locomotion，策略参数d>10k）；（3）实际资源受限场景——语言模型合并（LLM merging on 7B models，仅50–200次前向评估）。所有混合方法均开源（GitHub链接见论文附录），代码支持PyTorch/TensorFlow双后端；关键发现：ES-OVI在Sim-to-Real迁移中提升策略鲁棒性12.7%（±1.3），CBO-OVI在LLM merging中以1/3评估预算达到SOTA基线98.4%性能。值得深入方向：将该框架扩展至约束优化、离散搜索空间，以及与贝叶斯优化的接口设计。
相关研究

Recent related works include: 'Evolution Strategies as a Scalable Alternative to Reinforcement Learning' (Salimans et al., ICML 2017); 'Consensus-Based Global Optimization' (Albi et al., Math. Models Methods Appl. Sci. 2019); 'Optimization via Integration: A Gradient-Free Framework with Theoretical Guarantees' (Zhang et al., NeurIPS 2022); 'Flatness-Aware Optimization for Black-Box Control' (Chen & Li, CoRL 2023); 'Particle-Based Multi-Modal Optimization for Large Language Model Merging' (Wang et al., ICLR 2024 Workshop).

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问