王琦、杨毅远、江季李宏毅老师的《深度强化学习》是强化学习领域经典的中文教程之一,很多人选择的强化学习入门学习材料都是李宏毅老师的台大公开课视频。李宏毅老师的课程包括很多常见的强化学习算法,我们还补充了马尔可夫决策过程、Q-learning、Sarsa、REINFORCE等强化学习常见的算法及概念。展示了重要性采样的问题李宏毅老师的《深度强化学习》是强化学习领域经典的中文教程之一。

内容中包含的图片若涉及版权问题,请及时与我们联系删除