Trajectory Planning of Robotic Manipulator in Dynamic Environment Exploiting DRL

2024年03月25日
  • 简介
    这项研究是关于在机械臂轨迹规划中实现强化学习算法。我们使用了一个7自由度的机械臂,在未知环境中随机摆放的障碍物中抓取并放置随机目标点上的方块。障碍物是随机移动的,这给抓取物品带来了困难。机器人的目标是在固定时间戳的约束下避开障碍物并抓取方块。在本文中,我们应用了深度确定性策略梯度(DDPG)算法,并比较了模型在稠密和稀疏奖励下的效率。
  • 图表
  • 解决问题
    本论文旨在解决7-DOF机械臂在未知环境中避开障碍物、在规定时间内完成随机物体的抓取任务的问题。
  • 关键思路
    论文采用深度确定性策略梯度算法(DDPG)并比较了稠密奖励和稀疏奖励模型的效率。
  • 其它亮点
    论文的实验设计包括随机放置的障碍物和目标点、障碍物的随机移动等因素,同时使用了稠密和稀疏奖励模型进行对比,实验结果表明DDPG算法在机械臂路径规划中具有较高的效率和准确性。论文提供了开源代码和数据集,值得进一步研究。
  • 相关研究
    相关研究包括: 1. 'Deep Reinforcement Learning for Robotic Manipulation: A Review' 2. 'A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem' 3. 'Continuous Control with Deep Reinforcement Learning'
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论