【标题】Q-learning-based model predictive variable impedance control for physical human-robot collaboration
【作者团队】Loris Roveda, Andrea Testa, Asad Ali Shahid
【发表日期】2022.8.11
【论文链接】https://www.sciencedirect.com/science/article/pii/S0004370222001114
【推荐理由】在许多情况下越来越需要物理人机协作。为此,机器人应该能够识别人类的意图,并保证沿预期运动方向的安全和自适应行为。为此,本文提出了一种基于 Q-Learning 的模型预测可变阻抗控制 (Q-LMPVIC) 来协助操作员完成物理人机协作 (pHRC) 任务。笛卡尔阻抗控制回路旨在实现解耦的顺应机器人动力学。阻抗控制参数(即,设定点和阻尼参数)然后在线优化,以最大限度地提高 pHRC 的性能。为此,本文设计了一组神经网络来学习人机交互动力学的建模,同时捕捉相关的不确定性。然后,模型预测控制器 (MPC) 使用派生的建模,并通过 Lyapunov 约束增强稳定性保证。MPC 是通过使用 Q-Learning 方法来解决的,该方法在其在线实现中使用 actor-critic 算法来近似精确的解决方案。事实上,Q-learning 方法提供了一个准确且高效的解决方案。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢