【标题】Review of Metrics to Measure the Stability, Robustness and Resilience of Reinforcement Learning

【作者团队】Laura L. Pullum

【发表日期】2022.3.22

【论文链接】https://arxiv.org/ftp/arxiv/papers/2203/2203.12048.pdf

【推荐理由】近年来,强化学习受到了广泛关注,这主要是由于深度强化学习在解决许多挑战性任务(如下棋、围棋和在线电脑游戏)方面取得了成功。然而,随着强化学习越来越受到重视,游戏和模拟环境之外的应用需要了解强化学习方法的鲁棒性、稳定性和弹性。为此,本文进行了全面的文献综述,以描述这三种行为与强化学习相关的现有文献。通过对用于指示或测量稳健性、稳定性和弹性行为的定量和理论方法进行分类。并且确定了定量方法试图稳定、稳健或有弹性的行动或事件。最后,其提供了一个决策树,用于选择量化行为的指标。本文相信这是首次全面综述专门针对强化学习的稳定性、鲁棒性和弹性的研究。

内容中包含的图片若涉及版权问题,请及时与我们联系删除