Imitation Game: A Model-based and Imitation Learning Deep Reinforcement Learning Hybrid

2024年04月02日
  • 简介
    自主和学习系统基于深度强化学习已经牢固地确立为创建弹性和高效的物理能源系统方法的基础。然而,大多数当前的方法存在两个明显的问题:现代无模型算法(如Soft Actor Critic)需要大量的样本来学习有意义的策略,并且需要一种备用方法来防止概念漂移(例如,灾难性遗忘)。在本文中,我们介绍了一种混合智能体结构的正在进行的工作,它将基于模型的深度强化学习与模仿学习相结合,以克服这两个问题。
  • 图表
  • 解决问题
    论文旨在解决深度强化学习中样本数量要求高和概念漂移问题的挑战。
  • 关键思路
    论文提出了一种混合智能体架构,将基于模型的深度强化学习与模仿学习相结合,以克服这两个问题。
  • 其它亮点
    论文设计了实验来验证提出的混合智能体架构的有效性,并使用了多个数据集进行测试。论文还提供了开源代码。这项工作为解决深度强化学习中的样本数量和概念漂移问题提供了新思路。
  • 相关研究
    最近的相关研究包括:《Soft Actor-Critic Algorithms and Applications》、《Deep Reinforcement Learning for Autonomous Driving: A Survey》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论