- 简介本文提出了一种博弈论策略,用于赛车比赛中,自主驾驶车辆寻求阻挡竞争对手超车。在构建了轨迹候选库和相关的奖励矩阵之后,基于Level-K推理框架,确定了在规划时间范围内最大化累积奖励的最优轨迹。特别地,根据竞争对手在过去窗口期内的行为估计其水平,然后用于确定自主驾驶车辆的轨迹。考虑到竞争对手在自主驾驶车辆的决策过程中可能会改变其水平和策略,我们引入了一种轨迹混合策略,将Level-K最优轨迹与安全轨迹混合。该算法在各种模拟赛车场景下进行了测试和评估,其中还包括人在环实验。与传统的Level-K框架进行比较分析表明,我们提出的方法在阻挡超车成功率方面具有优越性。
- 图表
- 解决问题如何使用博弈论策略来解决自动驾驶汽车竞速中的超车问题?
- 关键思路使用基于级别K推理框架的最优轨迹决策算法,通过在线估计对手的水平来确定自动驾驶汽车的轨迹,同时引入混合轨迹策略以应对对手策略的变化。
- 其它亮点论文通过各种模拟竞速场景和人机交互实验,验证了算法的有效性。同时,提出的混合轨迹策略可以应对对手策略的变化,增强了算法的鲁棒性。
- 近期相关研究包括: 1. "Multi-Agent Reinforcement Learning for Robust Decision Making"; 2. "A Game-Theoretic Framework for Decision Making in Autonomous Driving"
沙发等你来抢
去评论
评论
沙发等你来抢