【标题】Autonomous Obstacle Avoidance and Target Tracking of UAV Based on Deep Reinforcement Learning
【作者团队】Guoqiang Xu, Weilai Jiang, Zhaolei Wang, Yaonan Wang
【发表日期】2022.3.19
【论文链接】https://link.springer.com/article/10.1007/s10846-022-01601-8
【推荐理由】在使用深度强化学习算法完成无人机自主避障和目标跟踪任务时,往往会存在收敛速度慢、成功率低等问题。 因此,本文提出了一种新的深度强化学习算法,即Multiple Pools Twin Delay Deep Deterministic Policy Gradient(MPTD3)算法。 首先,将无人机的状态空间和动作空间建立为连续模型,比离散模型更接近工程实践。 然后,设计了多个经验池机制和梯度截断,以提高算法的收敛性。 此外,通过赋予无人机环境感知能力,获得算法的泛化能力。 实验结果验证了所提方法的有效性。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢