Cooperative Advisory Residual Policies for Congestion Mitigation

2024年06月30日
  • 简介
    自动驾驶车队可以通过简单的措施缓解交通拥堵,从而改善通勤时间和汽油成本等许多社会经济因素。然而,这些方法在实践中存在限制,因为它们假定对自动驾驶车队具有精确的控制,需要为集中式传感器生态系统支付高昂的安装成本,并且也未能考虑到驾驶员行为的不确定性。为此,我们开发了一类学习残差策略,可用于合作咨询系统,并且只需要使用一个带有人类驾驶员的车辆。我们的策略建议驾驶员以缓解交通拥堵的方式行驶,同时考虑到不同的驾驶员行为,特别是驾驶员对指令的反应,以提供改进的用户体验。为了实现这样的策略,我们引入了一个改进的奖励函数,明确解决拥堵缓解和驾驶员对建议的态度。我们展示了我们的残差策略可以通过在变分自动编码器中学习推断驾驶员特质的条件下进行个性化。我们的策略在我们的新型指令遵从驾驶员模型中进行模拟训练,并通过模拟和用户研究(N=16)进行评估,以捕捉人类驾驶员的情感。我们的结果表明,我们的方法成功地缓解了拥堵,同时适应了不同的驾驶员行为,在模拟测试和用户研究中,根据速度和时间内的偏差的组合度量,相对于基线,分别提高了20%和40%。我们的用户研究进一步表明,我们的策略是人类兼容的,并且可以个性化驾驶员。
  • 图表
  • 解决问题
    论文旨在通过学习驾驶者行为和采用个性化建议,缓解交通拥堵问题。
  • 关键思路
    论文提出了一种基于学习的剩余策略,用于协作建议系统,仅需要一个带有人类驾驶员的车辆。该策略可根据驾驶员的性格特征进行个性化调整,同时考虑驾驶员对建议的反应。
  • 其它亮点
    论文提出的方法可以通过个性化建议和学习驾驶者行为,缓解交通拥堵问题,同时提高用户体验。论文使用了模拟和用户研究来验证方法的有效性。此外,论文还介绍了一种改进的奖励函数,以明确解决拥堵问题和驾驶员建议态度。
  • 相关研究
    与该论文相关的研究包括自主驾驶车辆控制、交通拥堵缓解和驾驶员行为建模等方面的研究。相关论文包括《Autonomous Vehicle Control Using Deep Reinforcement Learning》、《Traffic Congestion Alleviation via Autonomous Vehicles: Game-Theoretic Approach》和《Modeling Driver Behavior in a Cognitive Architecture》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论