400+页的MIT强化学习课程免费教材,根据2019-2023的MIT强化学习课程内容整理而来,涵盖了强化学习的基本概念、方法和应用,特别是近似动态规划、神经网络、策略迭代和蒙特卡洛树搜索等技术。

参考页面提供了教科书、课程材料、视频讲座和研究论文的链接,是强化学习领域重要参考资源《A Course in Reinforcement Learning》

下载地址:

https://event-cdn.baai.ac.cn/file/file-browser/ZJeJjwRwre4AxZbMKr2F5aZDhmcbXpDX.pdf 

 

包括带有解决方案的章末练习教材的一个重要结构特点是,它是以模块化的方式组织的,着眼于灵活性,所以它可以适应课程内容的变化和变化。

分为两个部分:

(1) 基础平台:它包含了对DP/RL概况的选择性概述,以及对其他RL主题进行更详细的课内开发的起点,其选择可以由教师决定。

(2) 在第二章中深入介绍确定性和随机性展开的方法,在第三章中结合策略迭代/自学和Q-learning,对神经网络和其他近似架构进行离线训练。

内容中包含的图片若涉及版权问题,请及时与我们联系删除