【标题】Intelligent Traffic Light via Policy-based Deep Reinforcement Learning

【作者团队】Yue Zhu, Mingyu Cai, Chris Schwarz, Junchao Li, Shaoping Xiao

【发表日期】2021.12.27

【论文链接】https://arxiv.org/pdf/2112.13817.pdf

【推荐理由】智能城市中的智能交通灯可以最佳地减少交通拥堵。本文使用强化学习在城市交通模拟器上训练交通灯的控制代理。与已有的研究不同,本文采用了基于策略的深度强化学习方法,即近端策略优化(PPO),而不是基于值的方法,如深度Q网络(DQN)和双DQN(DDQN)。首先,将PPO得到的最优策略与DQN和DDQN得到的最优策略进行了比较。研究发现,PPO策略的性能优于其他策略。其次,通过采用可变时间间隔的交通灯相位,而不是固定间隔的交通灯相位,这导致了更好的通过交通流的策略。然后,研究了环境扰动和动作扰动的影响,证明了基于学习的控制器的鲁棒性。最后,本文考虑了非平衡交通流,发现智能交通灯可以对非平衡交通场景进行适度的处理,尽管它只从平衡交通场景中学习最优策略。

内容中包含的图片若涉及版权问题,请及时与我们联系删除