随着AlphaGo的突破,深度强化学习已成为解决序列决策问题的一项公认技术。尽管深度强化学习声名远扬,由于其试错学习机制存在样本低效率问题,这项技术难以得到广泛应用。目前已经开发了许多用于高样本效率的深度强化学习方法,例如通过环境建模、经验迁移和分布式学习等。其中,分布式深度强化学习在诸多领域中展现出了巨大的潜力,如人机博弈和智能交通等。中国科学院自动化研究所黄凯奇研究员团队总结了这一领域的发展现状,比较了经典的分布式深度强化学习方法并梳理了实现高效分布式学习的重要组成部分,包括从单玩家单智能体分布式深度强化学习到最复杂的多玩家多智能体分布式深度强化学习。此外,文章还回顾了近期发布的工具箱,这些工具箱可以帮助实现分布式深度强化学习,而不需要对它们的非分布式版本进行太多修改。通过分析其优势与劣势,团队开发并发布了一个多玩家多智能体分布式深度强化学习工具箱,并在Wargame这一拥有复杂环境的游戏中进行了验证,证明了该工具箱在复杂游戏环境中的多玩家多智能体分布式深度强化学习能力。最后,文章尝试指出其面临的挑战及未来发展趋势,希望本文的简要综述能够为对分布式深度强化学习感兴趣的研究人员提供指导或启发。相关成果已发表于《机器智能研究(英文)》2024年第3期中。
全文导读
自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱
全文下载:
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox
Qiyue Yin, Tongtong Yu, Shengqi Shen, Jun Yang, Meijing Zhao, Wancheng Ni, Kaiqi Huang, Bin Liang & Liang Wang
https://link.springer.com/article/10.1007/s11633-023-1454-4
https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1454-4
关于Machine Intelligence Research
Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区。

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢