论文名称:Hyperparameter Auto-tuning in Self-Supervised Robotic Learning 作者:Jiancong Huang, Juan Rojas, Matthieu Zimmer, Hongmin Wu, Yisheng Guan, Paul Weng 论文链接:https://arxiv.org/abs/2010.08252 代码地址:http://www.juanrojas.net/autotune 推荐理由:强化学习中的策略优化要求,可以跨环境选择超参数。错误地修复它们可能会对优化性能产生负面影响,从而导致学习不足或冗余。本文作者提出一种可以自动调整超参数的方法。 自我监督型机器人学习中的超参数自动调整,使其在实践中更易于通过三个超参数的自动调整应用于不同的场景。为了选择适当的超参数值,作者估计并验证了损失函数具有与训练数据集的多样性相关的下界。作者所提方法的一个很好的特性是它不需要任何额外的计算成本,因为它直接使用了评估阶段已计算出的度量。实验表明,该方法可以根据给定任务目标的多样性自适应地选择参数,从而节省时间和资源。 本文贡献:(i)作者确定了损失函数的下限与样本的多样性有关;(ii)为避免学习效果欠佳或计算机资源浪费,作者提出了一种自动调整三个超参数的方法。