- 简介这项研究开发了一个可解释的人工智能系统,用于船舶避碰。首先,提出了一个评论网络,由子任务评论网络组成,以分别评估避碰中的每个子任务,以澄清涉及AI决策过程。此外,还尝试通过Q值分析和注意机制来识别行为意图。前者通过检查由AI行动导致的Q值增量来解释意图,而后者将其他船只在避碰决策过程中的重要性纳入学习目标中。通过将感知到的碰撞危险与对其他船只的关注程度相结合,可以可视化AI在避碰中的行为意图。该方法通过数值实验进行了评估。开发的AI被确认能够在各种拥堵水平下安全地避免碰撞,并且AI的决策过程对人类来说易于理解。该方法不仅有助于理解基于深度强化学习的控制器/系统在船舶避碰任务中的应用,还可以扩展到包含子任务的任何任务。
- 图表
- 解决问题本论文旨在开发一种可解释的人工智能来进行船舶避碰。研究试图解决船舶避碰问题中的决策过程难以理解的问题。
- 关键思路论文提出了一个评论家网络,由子任务评论家网络组成,以分别评估避碰中的每个子任务,以澄清涉及的人工智能决策过程。此外,通过Q值分析和注意机制,试图识别行为意图。
- 其它亮点论文通过数字实验对提出的方法进行了评估,并证实该人工智能能够在各种拥堵水平下安全避免碰撞,并且该方法不仅有助于理解基于深度强化学习的控制器/系统在船舶避碰任务中的决策过程,而且还可以扩展到包括子任务的任何任务。
- 最近在这个领域中,也有一些相关研究,例如“基于深度强化学习的无人机自主避碰方法”和“机器人避碰中的深度强化学习方法”。
沙发等你来抢
去评论
评论
沙发等你来抢