湖南大学|基于深度强化学习的无人机自主避障与目标跟踪

【标题】Autonomous Obstacle Avoidance and Target Tracking of UAV Based on Deep Reinforcement Learning

【作者团队】Guoqiang Xu, Weilai Jiang, Zhaolei Wang, Yaonan Wang

【发表日期】2022.3.19

【论文链接】https://link.springer.com/article/10.1007/s10846-022-01601-8

【推荐理由】在使用深度强化学习算法完成无人机自主避障和目标跟踪任务时，往往会存在收敛速度慢、成功率低等问题。因此，本文提出了一种新的深度强化学习算法，即Multiple Pools Twin Delay Deep Deterministic Policy Gradient（MPTD3）算法。首先，将无人机的状态空间和动作空间建立为连续模型，比离散模型更接近工程实践。然后，设计了多个经验池机制和梯度截断，以提高算法的收敛性。此外，通过赋予无人机环境感知能力，获得算法的泛化能力。实验结果验证了所提方法的有效性。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

湖南大学|基于深度强化学习的无人机自主避障与目标跟踪

评论列表

评论