HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios

2024年05月31日
  • 简介
    自动泊车是自动驾驶技术备受期待的应用之一。然而,现有的路径规划方法在处理现实中多样化和复杂的泊车场景方面存在不足。非学习方法提供可靠的规划结果,但容易受到复杂情况的影响,而基于学习的方法擅长探索,但不稳定且难以收敛到可行解。为了发挥两种方法的优势,我们引入了混合策略路径规划器(HOPE)。这种新颖的解决方案将强化学习代理与Reeds-Shepp曲线相结合,实现了跨多种场景的有效规划。HOPE通过应用动作掩码机制指导强化学习代理的探索,并采用转换器将感知到的环境信息与掩码相结合。为了促进所提出的规划器的训练和评估,我们提出了一种基于空间和障碍物分布的泊车场景难度级别分类标准。实验结果表明,我们的方法优于典型的基于规则的算法和传统的强化学习方法,在不同场景下具有更高的规划成功率和泛化能力。我们还进行了现实世界的实验,以验证HOPE的实用性。我们的解决方案的代码将在GitHub上公开提供。
  • 图表
  • 解决问题
    论文试图解决自动驾驶技术中的自动停车问题,现有的路径规划方法无法处理现实中复杂多样的停车场景,需要一种能够有效规划停车路径的新方法。
  • 关键思路
    论文提出了一种新的混合路径规划方法HOPE,将强化学习代理与Reeds-Shepp曲线相结合,通过动作屏蔽机制和Transformer来引导代理的探索,并将感知到的环境信息与屏蔽相结合。同时,论文提出了一种基于空间和障碍物分布的停车场景难度级别分类标准。
  • 其它亮点
    论文实验结果表明,HOPE方法在各种场景中都具有更高的规划成功率和泛化性能,优于传统的基于规则和强化学习的方法。论文还进行了现实世界的实验验证,代码将在GitHub上开源。
  • 相关研究
    近期的相关研究包括:'Autonomous Parking: A Review'、'Autonomous Parking Using Reinforcement Learning and Deep Neural Networks'、'A Hybrid Reinforcement Learning Approach for Autonomous Parking'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论