论文标题: Provably efficient multi-task reinforcement learning with model transfer (可证明的高效多任务强化学习与模型转移)

作者团队: 亚利桑那大学 & 圣地亚哥大学

论文链接: https://openreview.net/pdf?id=qPOeyokHXT8

推荐简介: 本文研究了表格偶发马尔科夫决策过程(MDPs)中的多任务强化学习(RL)。文章中提出了一个异质多玩家RL问题,其中一组玩家同时面对相似但不一定相同的MDP,目标是通过玩家间的信息共享提高他们的集体表现。本文设计并分析了一个基于模型的算法提供了依赖差距和不依赖差距的遗憾上界和下界,以描述该问题的内在复杂性。

算法流程:

内容中包含的图片若涉及版权问题,请及时与我们联系删除