Object Manipulation in Marine Environments using Reinforcement Learning

15th IFAC Conference on Control Applications in Marine Systems, Robotics and Vehicles (CAMS 2024)
2024年06月05日
  • 简介
    在海上执行干预任务对于安全和操作效率至关重要。不可预测和动态的海洋环境使得物体操作等干预任务极具挑战性。本研究提出了一种强健的解决方案,用于在海浪干扰下从码头进行物体操作。为了解决这个具有挑战性的问题,我们采用了一种基于深度强化学习(DRL)的算法,称为Soft Actor-Critic(SAC)。SAC采用演员-评论家框架;演员学习最小化目标函数的策略,评论家评估学习到的策略并提供反馈以指导演员学习过程。我们使用PyBullet动态模拟器对代理进行了训练,并在名为MBZIRC海上模拟器的逼真模拟环境中进行了测试。该模拟器允许根据世界气象组织(WMO)的海况代码模拟不同的海浪条件。模拟结果表明,在从码头检索物体时具有高成功率。在WMO海况代码表示的存在海浪的模拟环境中,经过训练的代理在海况2的情况下实现了80%的成功率。
  • 图表
  • 解决问题
    论文提出了一个解决海洋环境下物体操作的问题的方案。这是一个新问题吗?
  • 关键思路
    论文采用基于深度强化学习的算法Soft Actor-Critic(SAC)解决物体操作问题。该算法通过演员-评论家框架实现,演员学习最小化目标函数的策略,评论家评估学习到的策略并提供反馈以指导演员学习过程。
  • 其它亮点
    论文使用PyBullet动态模拟器进行智能体训练,并在MBZIRC海事模拟器中进行了测试。该模拟器允许根据世界气象组织(WMO)海况代码模拟不同的波浪条件。实验结果表明,在WMO海况代码为2的波浪条件下,训练后的智能体在模拟环境中取回物体的成功率高达80%。
  • 相关研究
    最近的相关研究包括使用深度强化学习解决物体操作问题的其他论文,如《基于深度强化学习的机器人抓取:综述与未来方向》和《基于深度强化学习的机器人物体操作:综述与未来方向》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论