【标题】Reinforcement Learning-Based Automatic Berthing System
【作者】Daesoo Lee
【发表日期】2021.12.3
【论文链接】https://arxiv.org/pdf/2112.01879.pdf
【推荐理由】先前对基于人工神经网络 (ANN) 的自动靠泊系统的研究表明,通过以船舶靠泊数据作为训练数据训练 ANN,显示出良好的靠泊性能。然而,由于人工神经网络需要大量的训练数据才能产生稳健的性能,基于人工神经网络的自动靠泊系统由于难以获得靠泊数据而受到一定的限制。本文为了克服这一困难,提出了基于强化学习 (RL) 算法之一、近端策略优化 (PPO) 的自动靠泊系统,由于 RL 算法可以通过反复试验来学习最佳控制策略通过与给定的环境进行交互并且不需要任何预先获得的训练数据,其中提议的基于 PPO 的自动靠泊系统中的控制策略控制船舶的每秒转数 (RPS) 和舵角。最后,表明所提出的基于 PPO 的自动靠泊系统消除了获取训练数据集的需要,并显示出在实际靠泊应用中的巨大潜力。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢