【标题】SCC-rFMQ: a multiagent reinforcement learning method in cooperative Markov games with continuous actions
(SCC-rFMQ:连续动作合作马尔科夫博弈中的多智能体强化学习方法)
【作者团队】Chengwei Zhang, Zhuobing Han, Bingfu Liu, Wanli Xue
【发表日期】2022.1.20
【论文链接】https://link.springer.com/content/pdf/10.1007/s13042-021-01497-0.pdf
【推荐理由】尽管已经提出了许多多智能体强化学习 (MARL) 方法来学习连续动作域中的最佳解决方案,但具有独立学习器 (IL) 的多智能体协作域受到的研究相对较少,尤其是在传统的 RL 领域。本文提出了一种基于样本的自主学习方法,称为具有递归频率最大 Q 值的样本连续协调 (SCC-rFMQ),它将具有连续动作的多智能体协作问题分为两层。第一层通过具有可变探索率的重采样机制从连续动作空间中采样有限的动作集,第二层评估采样动作集中的动作并使用强化学习合作方法更新策略。通过在两个层次上构建合作机制,SCC-rFMQ 可以有效地处理连续动作合作马尔可夫博弈中的合作问题。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢