南洋理工大学|迈向人在回路人工智能：通过实时人工指导提高深度强化学习以实现自动驾驶

【标题】Toward human-in-the-loop AI: Enhancing deep reinforcement learning via real-time human guidance for autonomous driving

【作者团队】Jingda Wu, Zhiyu Huang, Zhongxu Hu, Chen Lv

【发表日期】2022.7.20

【论文链接】https://www.sciencedirect.com/science/article/pii/S2095809922004878#!

【推荐理由】由于人类在复杂场景中表现出鲁棒性和适应性，将人类引入人工智能 (AI) 的训练循环至关重要，利用人类智能进一步推进机器学习算法。本文开发了一种基于实时人类指导 (Hug)-深度强化学习 (DRL) 的方法，用于端到端自动驾驶案例中的策略训练。借助新设计的人类与自动化之间的控制转移机制，人类能够在模型训练过程中在必要时实时干预和纠正智能体的不合理行为。基于这种人在回路的指导机制，开发了一种具有修改的策略和价值网络的参与者-评论家架构。Hug-DRL 的快速收敛性允许将实时人类指导动作融合到智能体的训练循环中，进一步提高 DRL 的效率和性能。Hug-DR通过对 40 名受试者的人在回路实验进行验证，并与其他最先进的学习方法进行比较。结果表明，所提出的方法可以有效地提高人工指导下的 DRL 算法的训练效率和性能，而不会对参与者的专业知识或经验提出特定要求。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

南洋理工大学|迈向人在回路人工智能：通过实时人工指导提高深度强化学习以实现自动驾驶

评论列表

评论