【标题】Search-Based Testing of Reinforcement Learning
【作者团队】Martin Tappler, Filip Cano Córdoba, Bernhard K. Aichernig, Bettina Könighofer
【发表日期】2022.5.7
【论文链接】https://arxiv.org/pdf/2205.04887.pdf
【推荐理由】深度强化学习 (RL) 的评估具有内在的挑战性。特别是学习策略的不透明性以及智能体和环境的随机性使得测试深度 RL 智能体行为变得困难。本文提出了一个基于搜索的测试框架,该框架具有广泛的新颖分析功能,可用于评估深度 RL 智能体的安全性和性能。对于安全测试,此框架使用搜索算法来搜索解决 RL 任务的参考轨迹。搜索的回溯状态(称为边界状态)构成了安全关键情况。本研究创建了安全测试套件,用于评估 RL 智能体在这些边界状态附近逃脱安全关键情况的能力。对于稳健的性能测试,本文通过模糊测试创建了一组不同的跟踪。这些模糊跟踪用于将智能体带入各种潜在的未知状态,从中将智能体的平均性能与模糊跟踪的平均性能进行比较。本研究将基于搜索的测试方法应用于任天堂的《超级马里奥兄弟》的 RL。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢