ORNL | 度量强化学习稳定性、鲁棒性和弹性的指标综述

【标题】Review of Metrics to Measure the Stability, Robustness and Resilience of Reinforcement Learning

【作者团队】Laura L. Pullum

【发表日期】2022.3.22

【论文链接】https://arxiv.org/ftp/arxiv/papers/2203/2203.12048.pdf

【推荐理由】近年来，强化学习受到了广泛关注，这主要是由于深度强化学习在解决许多挑战性任务（如下棋、围棋和在线电脑游戏）方面取得了成功。然而，随着强化学习越来越受到重视，游戏和模拟环境之外的应用需要了解强化学习方法的鲁棒性、稳定性和弹性。为此，本文进行了全面的文献综述，以描述这三种行为与强化学习相关的现有文献。通过对用于指示或测量稳健性、稳定性和弹性行为的定量和理论方法进行分类。并且确定了定量方法试图稳定、稳健或有弹性的行动或事件。最后，其提供了一个决策树，用于选择量化行为的指标。本文相信这是首次全面综述专门针对强化学习的稳定性、鲁棒性和弹性的研究。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ORNL | 度量强化学习稳定性、鲁棒性和弹性的指标综述

评论