由北京大学前沿计算研究中心助理教授董豪博士等编写的深度强化学习专著《深度强化学习:基础、研究与应用(Deep Reinforcement Learning: Foundamentals, Research and Applications)》英文版于2020年6月由 Springer 发行,中文简体、繁体版先后于2021年6月、2022年1月发行,并于2022年2月对中文简体版开放免费下载。
本书分为三大部分,覆盖了学习深度强化学习所需的所有内容。第一部分介绍了强化学习的基础知识、常用的深度强化学习算法及其实现方法。第二部分对精选的深度强化学习研究方向展开介绍,这对希望开展相关研究的读者非常有意义。为了帮助读者更加深入地理解深度强化学习细节并把相关技术应用到实际中,本书第三部分仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台等等,并提供相关的开源代码。
作者团队:本书作者团队全部为一线科研人员和开源社区成员,使用深度强化学习解决不同领域的问题。本书内容缩小了理论和实践之间的距离,提供了大量工程实现的细节和技巧。团队的多样性使得本书风格对不同领域的读者更为友好,并对代码库进行支持和维护。
编者团队:
董豪,北京大学计算机学院、前沿计算研究中心助理教授,博士生导师。于2019年秋获得英国帝国理工学院博士学位。研究方向主要涉及计算机视觉和机器人,目的是降低学习智能系统所需要的数据,实现自主学习。他致力于推广人工智能技术,是深度学习开源框架 TensorLayer 的创始人,并获得 ACM MM 2017年度最佳开源软件奖。他在英国帝国理工和英国中央兰开夏大学获得一等研究生和一等本科学位。
丁子涵,普林斯顿大学博士。于2019年获得英国帝国理工学院硕士学位,曾在加拿大 Borealis AI、腾讯 Robotics X 实验室有过工作经历。本科就读中国科学技术大学,获物理和计算机双学位。研究方向主要涉及强化学习、机器人控制、计算机视觉等。在 ICRA, IROS, NeurIPS, AAAI, IJCAI, Physical Review 等顶级期刊与会议发表多篇论文,是 TensorLayer-RLzoo、TensorLet 和 Arena 等开源代码库的贡献者。
仉尚航,北京大学计算机学院助理教授,博士生导师。于2018年博士毕业于美国卡内基梅隆大学,后于2020年加入加州大学伯克利分校 BAIR 实验室任博士后研究员。研究方向主要为开放环境泛化机器学习理论与系统,同时在计算机视觉和强化学习方向拥有丰富研究经验。在人工智能顶级期刊和会议上发表论文30余篇,并申请5项美中专利。获 AAAI'21最佳论文奖,美国2018年度“EECS Rising Star”,Adobe 学术合作基金,Qualcomm 创新奖提名等。
下载地址:https://deepreinforcementlearningbook.org/
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢