【标题】HTRON:Efficient Outdoor Navigation with Sparse Rewards via Heavy Tailed Adaptive Reinforce Algorithm
【作者团队】Kasun Weerakoon, Souradip Chakraborty, Nare Karapetyan
【发表日期】2022.7.8
【论文链接】https://arxiv.org/pdf/2207.03694.pdf
【推荐理由】本文提出了一种新方法来提高基于深度强化学习 (DRL) 的户外机器人导航系统的性能。 大多数现有的 DRL 方法都基于精心设计的密集奖励函数,这些函数可以学习环境中的有效行为。 本文通过仅使用稀疏奖励(易于设计)来规避这个问题,并提出了一种新的用于户外导航的自适应重尾强化算法,称为 HTRON。 HTRON的主要思想是利用重尾策略参数化,这隐含地诱导智能体在稀疏奖励设置中的探索。 作者在三种不同的户外场景中评估了 HTRON 针对 Reinforce、PPO 和 TRPO 算法的性能。 与其他方法获得的导航策略相比,HTRON观察到成功率平均增加了 34.41%,达到目标所需的平均时间步长减少了 15.15%,海拔成本减少了 24.9%。 此外,本文证明HTRON可以直接转移到 Clearpath Husky 机器人中,以在现实世界场景中执行户外地形导航。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢