【论文标题】 基于深度强化学习的机器人运动控制研究进展
【作者团队】董豪,杨静。李少波,王军,段仲静
【发表时间】2021-04-02
【机构】贵州大学机械工程学院
【论文连接】https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=KZYC2021040100B&v=OKAgri6ShmNpjHx1kdZgNjwHaRzApTbljCTU%25mmd2F4FVbDE7o64XP6oTcUFslvoEUoTA
【推荐理由】本文出自贵州大学机械工程学院,是一片综述性质的文章。作者从深度强化学习的发展开始讲起,叙述了基于值函数和策略梯度两类的典型深度强化学习算法,并介绍了五种常用的机器人控制仿真平台。再根据研究类型和机器人运动控制面向的五个方面,分别讲述了其研究进展。最后,对现有的挑战和未来的发展趋势进行了总结与展望。本文内容的结构如下:
- 深度强化学习:对强化学习、深度强化学习的概念和发展做了简要介绍。并将机器人运动控制的深度强化学习方法分为基于值函数和基于策略梯度两类方法,对各自典型算法进行了详细介绍(值函数:DQN, Double DQN, Dueling DQN, NAF;策略梯度:TRPO, PPO, DDPG, A3C)。
- 仿真平台:解释了机器人控制任务中的sim2real的概念。简要介绍了Gazebo,PyBullet,MuJoco,V-REP,Webots这五个机器人运动控制的仿真平台。
- 基于DRL的机器人运动控制研究进展:以DRL+机器人控制为主题,结合了数个重要的科研平台上的相关内容,对机器人领域中五个不同的控制任务面向做了科研进展的介绍:自助导航、物体抓取、步态控制、人机协作、群体协同。
- 挑战与展望:首先叙述了深度强化学习作为机器学习中的一个新兴领域,在解决实际任务时,机器人运动控制面临的挑战。又对DRL中机器人控制的未来发展和研究方向做了总结:DRL与模型结合、创新奖励方式、通用控制策略、高效学习机制、多模态融合。最后对基于DRL的机器人运动控制研究存在的局限性进行了思考。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢