【标题】Robust Meta-Reinforcement Learning with Curriculum-Based Task Sampling
【作者团队】Morio Matsumoto, Hiroya Matsuba, Toshihiro Kujirai
【发表日期】2022.3.31
【论文链接】https://arxiv.org/pdf/2203.16801.pdf
【推荐理由】元强化学习(Meta-RL)获得的元策略在广泛的任务分布中表现出良好的性能。然而,传统的元RL通过随机抽样任务来学习元策略,据报道,它对某些任务表现出元过度拟合,尤其是对于容易获得高分的任务。为了减少元过度拟合的影响,本文考虑了基于课程的任务抽样的元RL。该方法是基于引导任务抽样的稳健元强化学习(RMRL-GTS),这是一种有效的方法,可以限制基于分数和时代的任务抽样,研究表明,为了实现鲁棒的元RL,不仅需要对分数较低的任务进行密集抽样,还需要限制和扩展待抽样任务的任务区域。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢