- 简介分散和终身自适应的多智能体协作学习旨在增强多个智能体之间的协作,而无需中央服务器,每个智能体随时间解决各种任务。为了实现有效的协作,智能体应该:i)自主地在分散的方式下识别有益的协作关系;和ii)适应动态变化的任务观察。在本文中,我们提出了DeLAMA,一种带有动态协作图的分散多智能体终身协作学习算法。为了促进自主协作关系学习,我们提出了一种分散的图结构学习算法,消除了对外部先验的需求。为了促进对动态任务的适应,我们设计了一个记忆单元,以捕获智能体的累积学习历史和知识,同时保持有限的存储消耗。为了进一步增强系统的表达能力和计算效率,我们应用算法展开,利用数学优化和神经网络的优势。这允许智能体通过培训任务的监督来“学习协作”。我们的理论分析验证了在少量通信轮下,智能体之间的协作是通信有效的。实验结果验证了其促进协作策略发现和适应动态学习场景的能力,实现了98.80%的MSE降低和188.87%的分类准确性提高。我们期望我们的工作可以作为未来智能、分散和动态多智能体系统的基础技术。代码可在https://github.com/ShuoTang123/DeLAMA上找到。
-
- 图表
- 解决问题提出了一种去中心化、终身自适应的多智能体协作学习算法,旨在促进多智能体之间的协作,同时适应动态任务观察。
- 关键思路提出了DeLAMA算法,通过去中心化图结构学习算法和记忆单元来促进多智能体之间的自主协作关系学习和适应动态任务,同时应用算法展开来增强系统的表达能力和计算效率。
- 其它亮点实验结果表明,DeLAMA算法能够促进协作策略的发现和适应动态学习场景,达到了98.80%的MSE降低和188.87%的分类准确率提高。代码已开源。
- 近期相关研究包括:Multi-Agent Reinforcement Learning,Decentralized Multi-Agent Reinforcement Learning,Lifelong Machine Learning等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流