【论文标题】空中交通管理的分层多智能体强化学习方案Hierarchical multiagent reinforcement learning schemes for air trafficmanagement 【作者团队】Christos Spatharis1•Alevizos Bastas2•Theocharis Kravaris2•Konstantinos Blekas1•George A. Vouros2•Jose Manuel Cordero 【发表时间】2021-1-16 【研究机构】University of Ioannina 【论文链接】https://link.springer.com/article/10.1007/s00521-021-05748-7 【推荐理由】 在这项工作中,文章研究使用分层多智能体强化学习方法来计算策略,以解决空中交通管理领域的拥塞问题。为了解决空域使用需求超过容量的情况,文章考虑了代表航班的代理,他们需要在作战前的战术阶段决定地面延误,以便在遵守空域容量限制的情况下执行其轨迹。通过将任务划分为状态和/或动作的层次结构,层次式强化学习能够处理具有高度复杂性的现实问题。这为探索国家行为空间,构建有利的决策机制提供了有效途径。文章首先建立了一个层次化多智能体强化学习的一般框架,然后进一步提出了四种不同的抽象方案,即状态抽象、动作抽象或两者兼而有之。为了定量评估所提出方法的解决方案的质量,并展示分层方法在解决需求-容量平衡问题中的潜力,文章提供了实际评估案例的实验结果,其中测量了每个航班的平均延误和延误航班数。

内容中包含的图片若涉及版权问题,请及时与我们联系删除