【标题】Autonomous Open-Ended Learning of Tasks with Non-Stationary Interdependencies
【作者团队】Alejandro Romero, Gianluca Baldassarre, Richard J. Duro, Vieri Giuliano Santucci
【发表日期】2022.5.16
【论文链接】https://arxiv.org/pdf/2205.07562.pdf
【推荐理由】自主开放式学习是机器学习和机器人技术中的一种相关方法,它允许人工智能体的设计能够获得目标和运动技能,而无需用户分配任务。这种方法的一个关键问题是制定策略,以确保智能体在尽可能短的时间内尽可能多地完成任务。事实证明,内在动机会产生一种任务不可知的信号,在目标之间合理分配训练时间。在之前工作的基础上,作者在决策层面解决了关键问题(即构建策略以在目标之间正确选择),并提出了一种分层架构,将子任务选择视为马尔可夫决策过程,能够在内在生成动机的基础上正确学习相互依赖的技能。本文首先深化了对之前系统的分析,展示了在更高层次的体系结构(即目标选择)上整合任务之间关系信息的重要性。然后,介绍了H-GRAIL,这是一个新的系统,它通过添加一个新的学习层来存储自主获取的任务序列,以便在相互依赖是非平稳的情况下修改它们。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢