动手学强化学习

Hands-on Reinforcement Learning

丰富图文内容

对每一章节的内容,我们都尽量深入浅出的描述其原理与算法

从基础到前沿

我们涵盖了强化学习的基础内容,以及强化学习中一些前沿方向的内容

代码在线运行

我们为每一章内容提供了Jupyter Notebook链接,可以在线直接运行

欢迎来到 动手学强化学习

张伟楠老师强化学习网课视频材料已经在伯禹学习平台完全免费开放。若大家想要观看视频学习,可以点击右上角“视频课程”前往。

动手学强化学习(Hands-on RL)旨在为国内学生和研究者提供一个友好的 RL 学习环境。在这里,我们希望读者能够真正学习到强化学习的知识,并且对代码实现过程有更加清晰的认识。该动手学强化学习项目后续将会出版成书。

本书一共分为三个部分,分别为动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL,即状态和动作空间都是有限的;进阶篇的内容突破这一限制,考虑连续的状态或动作,此时我们会使用到神经网络。最后,在前沿篇我们会介绍强化学习领域一些有趣的方向,以及相对应的前沿算法。

我们首先上线了前半本书的内容,从多臂老虎机谈起,一直到 Actor-Critic 算法。我们将持续上线后续章节的内容。

本书仍在不断迭代更新中,我们希望听取大家的意见,大家一起把它完善得更好。若有任何想与我们说的,例如有什么地方写得不清楚、哪里的代码有问题、有什么话想要吐槽的,都欢迎与我们联系。我们在右上角提供了一个匿名反馈渠道,也可以通过邮箱告知我们。

作者

张伟楠
上海交通大学副教授,博士生导师,曾获上海 ACM 新星奖,达摩院青橙奖等奖项
沈键
上海交通大学 APEX 实验室博士生,研究方向为强化学习和数据挖掘
俞勇
上海交通大学特聘教授,博士生导师,入选首批“国家高层次人才特殊支持计划”教学名师

此外,我们由衷感谢上海交通大学 APEX 数据和知识管理实验室强化学习小组的同学们为本书做出了卓越的贡献,包括王可容、王航宇、刘伟、郭睿涵、张志成、张扬天、何泰然、吴润哲、赵寒烨、陈程、陈铭城、周铭、王锡淮、赖行、朱梦辉等。