论文名称:A survey of motion planning algorithms for intelligent robotics 作者:Chengmin Zhou, Bingding Huang, Pasi Fränti 提交日期:2021.02.04 论文链接:https://arxiv.org/abs/2102.02376 推荐理由: 本文针对运动规划的监督学习、最优价值强化学习,策略梯度强化学习等典型算法进行了汇总和分析对比。作者研究的传统规划算法包括图形搜索算法,基于采样的算法和插值曲线算法。监督学习算法包括MSVM,LSTM,MCTS和CNN。最佳价值强化学习算法包括Q学习,DQN,双DQN,决斗DQN。策略梯度算法包括策略梯度方法,参与者批评算法,A3C,A2C,DPG,DDPG,TRPO和PPO。还引入了新的一般准则,以通过分析比较来评估运动计划算法的性能和应用。重点分析了最优值的收敛速度和稳定性以及策略梯度算法。根据运动规划算法的原理和分析比较分析性地提出了未来的方向。本文为研究人员提供了对运动计划算法在机器人技术中的优缺点,关系和未来的清晰而全面的理解,并为更好的运动计划算法铺平了道路。 本文贡献: 本文仔细分析了运动计划算法的原理,这些算法包括传统的规划算法、监督学习,最优值rL和策略梯度RL。并根据其原理进行了直接比较。因此,对运动计划算法的机理有了清晰的理解,并根据新标准对这些算法进行了分析比较,这些新标准包括局部或全局规划、路径长度、最佳速度、反应速度、安全距离和时间顺序路径。获得了这些算法的一般性能及其潜在的应用领域。比较了最佳值Rl和策略梯度rl的收敛速度和稳定性。提供了这些算法在网络融合中的详细而清晰的理解。最后,分析了常见的运动计划任务:安全高效的长距离运动计划(由机器人进行长途行李运送),根据包括数据收集、数据预处理、运动计划和决策在内的处理步骤进行。获得了潜在的研究方向,为进一步改进运动规划算法或运动规划系统铺平道路。

内容中包含的图片若涉及版权问题,请及时与我们联系删除