- 简介本文介绍了深度强化学习(DRL)的概念,该方法通过训练有效的策略最大化自定义奖励,使系统与环境互动并采取行动。在自动驾驶中,DRL可用作高层决策的策略,而低层算法(如混合A*路径规划)已被证明能够解决局部轨迹规划问题。本文将这两种方法结合起来,其中DRL做出高层决策,例如车道变换命令。在获得车道变换命令后,混合A*规划器能够生成无碰撞的轨迹,由模型预测控制器(MPC)执行。此外,DRL算法能够在选择的时间段内保持车道变换命令的一致性。交通规则使用线性时态逻辑(LTL)实现,然后用作DRL中的奖励函数。此外,我们在实际系统上验证了所提出的方法,以展示从仿真到实际硬件实施的可行性。
-
- 图表
- 解决问题本论文旨在利用深度强化学习(DRL)与混合A *路径规划算法相结合,解决自动驾驶中的高级决策制定和局部轨迹规划问题。
- 关键思路该论文提出了一种基于DRL和混合A*路径规划的自动驾驶决策制定方法,使用线性时间逻辑(LTL)作为奖励函数,实现交通规则控制。
- 其它亮点论文在真实系统上验证了该方法的可行性,实验设计详细,使用了开源数据集和模型,同时提出了一些值得深入研究的问题。
- 近期在自动驾驶领域中,有一些相关研究,如:“End-to-end Learning for Autonomous Driving using an Convolutional Neural Network (CNN)”,“Deep Reinforcement Learning for Autonomous Driving: A Survey”,“A Comprehensive Survey of Deep Learning for Autonomous Driving”等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流