CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning

2024年05月02日
  • 简介
    传统的基于优化的规划器虽然有效,但计算成本高,导致轨迹生成缓慢。为了减少计算时间,一种成功的策略是使用模仿学习(IL)从规划器中开发出快速的神经网络(NN)策略,这些规划器被视为专家演示者。虽然生成的NN策略能够快速生成类似于专家的轨迹,但是(1)它们的输出没有明确考虑动态可行性,(2)这些策略不能适应与训练期间不同的约束条件的变化。 为了克服这些限制,我们提出了一种名为约束引导扩散(CGD)的新型基于IL的轨迹规划方法。CGD利用混合学习/在线优化方案,将扩散策略与替代高效优化问题相结合,从而实现生成无碰撞、动态可行的轨迹。CGD的关键思想包括将专家解决的原始挑战性优化问题分成两个更易处理的子问题:(a)有效地找到无碰撞路径,(b)确定动态可行的时间参数化,以获得轨迹。与传统神经网络架构相比,我们通过数值评估证明,在遇到训练期间从未遇到的新约束条件的情况下,性能和动态可行性都有显着的改善。
  • 作者讲解
  • 图表
  • 解决问题
    解决问题:论文旨在通过Constraint-Guided Diffusion (CGD)方法解决Imitation Learning (IL)生成的轨迹规划神经网络模型不能显式考虑动态可行性和适应新约束条件的问题。
  • 关键思路
    关键思路:CGD采用混合学习/在线优化方案,将原始的优化问题分解为两个子问题,即有效地找到无碰撞路径和确定动态可行的时间参数化,以获得轨迹。相比于传统的神经网络结构,CGD在新约束条件下的性能和动态可行性方面都有显著改进。
  • 其它亮点
    其他亮点:论文通过数值评估证明了CGD方法的有效性和优越性,并提供了开源代码。实验数据集包括了新的约束条件,CGD在这些条件下的表现优于传统方法。值得进一步研究的是,如何在更复杂的场景下应用CGD,并探索更多的子问题分解方法。
  • 相关研究
    相关研究:最近的相关研究包括基于强化学习的轨迹规划方法,如Deep Reinforcement Learning for Vision-Based Robotic Grasping: A Simulated Comparative Evaluation和A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问