【标题】Target localization using Multi-Agent Deep Reinforcement Learning with Proximal Policy Optimization

【作者团队】Ahmed Alagha, Shakti Singh, Rabeb Mizouni

【发表日期】2022.6.27

【论文链接】https://www.sciencedirect.com/science/article/pii/S0167739X22002266

【推荐理由】目标定位是指根据传感智能体(机器人、无人机)收集的传感数据读数来识别目标位置,调查某个感兴趣的区域。现有的解决方案要么依赖于通过融合和分析收集的感官数据来估计目标位置,要么依赖于预定义和数据驱动的调查路径。然而,这些方法的适应性仍然是一个问题,因为增加环境的复杂性和动态性需要进一步的重新建模和监督。本文提出了几种多智能体深度强化学习(MDRL)模型来解决多智能体系统中的目标定位问题。在这项工作中,Actor-Critic 结构与卷积神经网络 (CNN) 一起使用,并使用近端策略优化 (PPO) 进行了优化。智能体的观察数据被建模为二维热图,捕获所有智能体的位置和传感器读数。智能体之间的合作是使用基于团队的奖励来诱导的,并通过使用用于分散执行的集中学习方法确保智能体数量的可扩展性,而通过图像下采样和高斯滤波器实现观察大小的可扩展性。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除