- 简介这项研究探索了一种新的交通优化方法,通过在混合自主驾驶环境中采用多智能体展开方法来协调人类驾驶车辆的速度,从而动态优化交通流量,减轻高速公路瓶颈处的拥堵。研究将问题建模为分散的部分可观察马尔可夫决策过程(Dec-POMDP),并提出了一种改进的多智能体展开算法。通过逐个智能体的策略迭代,该方法隐含地考虑了多个智能体之间的合作,并且可以无缝地适应智能体数量动态变化的复杂场景。在具有不同自主驾驶车辆渗透率和交通流量的真实网络中验证,模拟结果表明,多智能体展开算法显著提高了性能,使瓶颈路段的平均旅行时间降低了9.42%,当自主驾驶车辆渗透率为10%时。
-
- 图表
- 解决问题该论文探索了在混合自动化环境中采用多智能体方法来优化交通流的新方法,旨在通过纵向控制自动驾驶车辆来协调人类驾驶车辆的速度,以实时动态优化交通流并缓解高速公路瓶颈。
- 关键思路该论文将问题建模为分散的部分可观察的马尔科夫决策过程(Dec-POMDP),并提出了一种改进的多智能体方法,通过代理策略迭代隐式考虑多个代理之间的合作,并无缝地适应代理数量动态变化的复杂场景。
- 其它亮点该论文通过在现实网络中验证,证明了多智能体方法显著提高了性能,在10%自动驾驶车辆渗透率下,瓶颈路段的平均旅行时间缩短了9.42%。
- 在最近的相关研究中,也有一些类似的探索,比如《Distributed Multi-Agent Reinforcement Learning for Cooperative Traffic Signal Control》和《Multi-Agent Reinforcement Learning for Traffic Light Control》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流