【标题】Exploration in Deep Reinforcement Learning: A Survey
【作者团队】Pawel Ladosz, Lilian Weng, Minwoo Kim, Hyondong Oh
【发表日期】2022.5.2
【论文链接】https://arxiv.org/pdf/2205.00824.pdf
【推荐理由】本文综述了深度强化学习中的探索技术。在解决稀疏奖励问题时,探索技术是最重要的。在稀疏奖励问题中,奖励很少,这意味着代理通常不会通过随机行为找到奖励。在这种情况下,学习奖励和行动关联对强化学习来说是一个挑战。因此,需要设计更复杂的勘探方法。本综述全面概述了现有的勘探方法,根据主要贡献将其分类如下:奖励新状态、奖励不同行为、基于目标的方法、概率方法、基于模仿的方法、安全勘探和基于随机的方法。然后,讨论了尚未解决的挑战,以提供有价值的未来研究方向。最后,从复杂性、计算量和总体性能方面对不同类别的方法进行了比较。




内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢