- 简介本文介绍了一个基于多智能体强化学习(MARL)的可变速限制(VSL)控制系统在田纳西州纳什维尔附近的I-24高速公路上的首次现场部署。我们描述了如何在交通模拟器中训练MARL代理,并直接将基于模拟的策略部署在长达17英里、拥有67个VSL控制器的I-24高速公路上。我们使用无效操作屏蔽和多个安全保护来确保发布的速度限制符合来自交通管理中心和田纳西州交通部的现实约束。自系统启动至2024年4月,该系统已经在800万次行程中做出了约1000万个决策。控制器的分析表明,MARL策略在没有安全保护的干预下,最多占据了98%的控制时间。时空图表明了算法在高峰期的行为。最后,我们量化了模拟和真实数据之间的领域不匹配,并展示了MARL策略对此不匹配的鲁棒性。
-
- 图表
- 解决问题研究多智能体强化学习在变速限制控制系统中的应用,以解决高速公路拥堵问题。
- 关键思路使用多智能体强化学习训练控制器,并在田纳西州I-24高速公路上进行实地测试。通过无效动作屏蔽和多项安全保障措施确保控制器符合实际交通管理中心和田纳西州交通部门的限制条件。
- 其它亮点实现了多智能体强化学习控制器在真实道路环境中的应用。控制器能够自主地控制变速限制,减少拥堵并提高路段通行效率。
- 最近的相关研究包括: 1. Multi-Agent Reinforcement Learning for Traffic Signal Control 2. A Multi-Agent Reinforcement Learning Approach to Traffic Signal Control
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流