【标题】CLAMGen: Closed-Loop Arm Motion Generation via Multi-view Vision-Based RL 【作者团队】Iretiayo Akinola, Zizhao Wang, Peter Allen 【研究机构】哥伦比亚大学 【发表时间】2021.3.24 【论文链接】原文链接 【代码链接】代码链接 【推荐理由】本文提出CLAMGen--基于视觉的强化学习(RL)算法,用于手臂伸展问题的闭环轨迹生成.该方法利用贪婪的目标获得RL策略作为基础来改进探索,并将残差状态-动作值和从图像中学到的残差动作增强到基础策略以避免障碍。
本文提出了一种基于视觉的强化学习(RL)方法,用于手臂伸展问题的闭环轨迹生成。手臂轨迹生成是一个基本的机器人问题,它需要寻找无碰撞的路径来移动机器人的身体(如手臂),以满足一个目标(如放置末端执行器在一个点)。虽然经典的方法通常需要环境模型来解决规划、搜索或优化问题,但基于学习的方法有望直接从观察映射到机器人动作。然而,由于各种原因,包括但不限于部分可观测性、较差的探索性、低采样效率和学习不稳定性,使用逆向学习学习碰撞避免策略仍然是一个挑战。为了解决这些挑战,本文提出了一种残差RL方法,该方法利用贪婪的目标获得RL策略作为基础来改进探索,并将残差状态-动作值和从图像中学到的残差动作增强到基础策略以避免障碍。此外,本文引入了新的学习目标和技术,以提高从多个图像视图的3D理解和该算法的样本效率。与RL基线相比,该方法在成功率方面取得了优异的性能。
图1:CLAMGen框架
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢