【标题】Risk Perspective Exploration in Distributional Reinforcement Learning

【作者团队】Jihwan Oh, Joonkee Kim, Se-Young Yun

【发表日期】2022.6.28

【论文链接】https://arxiv.org/pdf/2206.14170.pdf

【推荐理由】分布式强化学习在具有方差和风险特征的连续和离散控制设置中展示了最先进的性能,可用于探索。然而,使用风险属性的探索方法很难找到,尽管分布式 RL 中的许多探索方法都使用了每个动作的回报分布的方差。本文提出了从风险角度探索风险水平和乐观行为的风险调度方法。本文通过综合实验证明了在多智能体设置中使用风险调度来提高 DMIX 算法的性能。

内容中包含的图片若涉及版权问题,请及时与我们联系删除