坎皮纳斯州立大学 | 离线强化学习综述：分类、回顾和开放性问题

【标题】A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open Problems

【作者团队】Rafael Figueiredo Prudencio, Marcos R. O. A. Maximo, Esther Luna Colombini

【发表日期】2022.3.2

【论文链接】https://arxiv.org/pdf/2203.01387.pdf

【推荐理由】随着深度学习的广泛采用，强化学习（RL）的受欢迎程度显著提高，并扩展到以前难以解决的问题，例如通过像素观察玩复杂游戏、与人类保持对话以及控制机器人代理。然而，由于与环境交互的高成本和危险性，仍有许多领域是RL无法访问的。离线RL是一种仅从先前收集的交互的静态数据集学习的范例，使得从大型和多样化的培训数据集中提取策略成为可能。有效的离线RL算法比在线RL有更广泛的应用范围，尤其适合教育、医疗和机器人等现实世界的应用。本文提出了一个统一的分类法来对离线RL方法进行分类。此外，本文还全面综述了该领域最新的算法突破，并回顾了现有基准的特性和缺点。最后，对开放性问题提出了自己的观点，并对这个快速发展的领域提出了未来的研究方向。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

坎皮纳斯州立大学 | 离线强化学习综述：分类、回顾和开放性问题

评论列表

评论