对每一章节的内容,我们都尽量深入浅出的描述其原理与算法
我们涵盖了强化学习的基础内容,以及强化学习中一些前沿方向的内容
我们为每一章内容提供了Jupyter Notebook链接,可以在线直接运行
张伟楠老师强化学习网课视频材料已经在伯禹学习平台完全免费开放。若大家想要观看视频学习,可以点击右上角“视频课程”前往。
动手学强化学习(Hands-on RL)旨在为国内学生和研究者提供一个友好的 RL 学习环境。在这里,我们希望读者能够真正学习到强化学习的知识,并且对代码实现过程有更加清晰的认识。该动手学强化学习项目已经整理成书,详情请见京东链接。
本书一共分为三个部分,分别为动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL,即状态和动作空间都是有限的;进阶篇的内容突破这一限制,考虑连续的状态或动作,此时我们会使用到神经网络。最后,在前沿篇我们会介绍强化学习领域一些有趣的方向,以及相对应的前沿算法。
我们首先上线了前半本书的内容,从多臂老虎机谈起,一直到 Actor-Critic 算法。我们将持续上线后续章节的内容。
本书仍在不断迭代更新中,我们希望听取大家的意见,大家一起把它完善得更好。若有任何想与我们说的,例如有什么地方写得不清楚、哪里的代码有问题、有什么话想要吐槽的,都欢迎与我们联系。我们在右上角提供了一个匿名反馈渠道,也可以通过邮箱告知我们。
此外,我们由衷感谢上海交通大学 APEX 数据和知识管理实验室强化学习小组的同学们为本书做出了卓越的贡献,包括王可容、王航宇、刘伟、郭睿涵、张志成、张扬天、何泰然、吴润哲、赵寒烨、陈程、陈铭城、周铭、王锡淮、赖行、朱梦辉等。