【作者团队】Sam Powers, Eliot Xing, Eric Kolve, Roozbeh Mottaghi, Abhinav Gupta  date:  30 Sept 2021

【论文链接】https://openreview.net/pdf?id=Fr_KF_lMCMr

【推荐理由】由于一些进入障碍,持续强化学习的进展受到限制:缺少代码、高计算要求和缺乏合适的基准。在这项工作中,论文介绍了CORA,一个用于持续强化学习代理的平台,它在单个代码包中提供基准、基线和度量。论文提供的基准旨在评估持续RL挑战的不同方面,如灾难性遗忘、可塑性、概括能力和样本有效学习。其中三个基准使用视频游戏环境(Atari、Procgen、NetHack)。第四个基准,家务,由视觉逼真的家庭模拟器中的四个不同的任务序列组成,从不同的任务和场景参数集合中提取。为了比较这些基准上的连续RL方法,在CORA中准备了三个指标:连续评估、遗忘和零镜头前向转移。最后,CORA包含了一组现有算法的性能、开源基线,供研究人员使用和扩展。作者发布了CORA。

内容中包含的图片若涉及版权问题,请及时与我们联系删除