- 简介深度强化学习在多无人机系统的在线路径规划任务中取得了显著的进展。然而,现有的基于深度强化学习的方法在处理未知情景时往往会遭受性能下降,因为视觉表示中的非因果因素会对策略学习产生负面影响。为了解决这个问题,我们提出了一种新颖的表示学习方法,即因果表示分离,可以识别表示中的因果和非因果因素。然后,我们仅传递因果因素进行后续的策略学习,从而明确地消除了非因果因素的影响,有效提高了深度强化学习模型的泛化能力。实验结果表明,我们提出的方法可以在未知情景中实现稳健的导航性能和有效的避碰,这显著优于现有的最先进算法。
-
- 图表
- 解决问题如何提高多UAV系统的在线路径规划性能,尤其是在未知场景下?
- 关键思路通过因果表示分离的方法,识别视觉表示中的因果和非因果因素,只使用因果因素进行策略学习,以明确消除非因果因素的影响,从而提高深度强化学习模型的泛化能力。
- 其它亮点实验结果表明,该方法在未知场景中实现了强大的导航性能和有效的碰撞避免,显著优于现有的算法,值得进一步研究。
- 最近的相关研究包括:Multi-UAV路径规划、深度强化学习、因果表示学习等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流