【标题】DDA3C: Cooperative Distributed Deep Reinforcement Learning in A Group-Agent System
【作者团队】Kaiyue Wu, Xiao-Jun Zeng
【发表日期】2022.2.10
【论文链接】https://arxiv.org/pdf/2202.05135.pdf
【推荐理由】如果多个智能体协同执行各自的强化学习任务,则可极大地改善每个智能体的强化学习过程。这些任务可能并不完全相同,但由于任务的相似性,它们仍然受益于代理之间的通信行为。事实上,这个学习场景还没有被很好地理解和制定。作为第一项工作,本文通过对该场景进行详细的讨论,并提出了群体agent强化学习作为该场景下强化学习问题的表述,以及关于单agent和多agent强化学习的第三类强化学习问题。本文提出借助现代深度强化学习技术可以解决此问题,并提供了分布式深度强化学习算法DDA3C(Discentralised distributed Asynchronous Advantage Actor Critic,去中心化分布式异步优势演员-评论家),其为第一个为群代理强化学习设计的框架。并在CartPole-v0游戏环境中的实验表明DDA3C 取得了理想的性能并具有良好的可扩展性。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢