【标题】Train timetabling with the general learning environment and multi-agent deep reinforcement learning
【作者团队】Wenqing Li, Shaoquan Ni
【发表日期】2022.2.15
【论文链接】https://www.sciencedirect.com/science/article/pii/S019126152200025X
【推荐理由】针对不同铁路系统的列车时刻表问题,提出了一种多智能体深度强化学习方法。构造了一个通用的列车时刻表学习环境,将问题建模为一个马尔可夫决策过程,在该过程中,问题的目标和复杂约束可以有效地分布。通过细微的变化,环境可以在广泛使用的双线铁路系统和更复杂的单线铁路系统之间灵活切换。为了解决维数灾难问题,提出了一种多智能体行动者-批评家算法框架,将大型组合决策空间分解为多个独立的决策空间,并用深度神经网络对其进行参数化。使用一个真实实例和几个测试实例对所提出的方法进行了测试。实验结果表明,该方法可以在合理的计算时间内获得单轨列车时刻表问题的合作策略,在解的最优性方面优于几种常用的方法,通过稍微改变环境,该方法可以很容易地推广到双轨列车时刻表问题。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢