【教程简介】:本教程概括介绍了基于模型的强化学习(MBRL)领域,特别强调了深度方法。MBRL方法利用环境模型来做出决策,而不是将环境视为一个黑匣子,并提供了超越无模型RL的独特机会和挑战。教程讨论学习过渡和奖励模型的方法,这些模型可以有效地用于做出更好的决策的方式,以及规划和学习之间的关系。作者还强调了世界模型在典型RL设置之外的利用方式,以及在设计未来MBRL系统时,从人类认知中可以得出什么见解。通过该教程你可以获得:阅读和跟进有关该主题的文献的数学背景;对所涉及的算法有直观的理解;意识到应用基于模型的方法所涉及的权衡和挑战;赞赏可以应用基于模型的推理的问题的多样性;了解这些方法如何适应更广泛的强化学习和决策理论以及与无模型方法的关系。
【讲座链接】:https://sites.google.com/view/mbrl-tutorial

内容中包含的图片若涉及版权问题,请及时与我们联系删除