本页面提供张伟楠老师在上海交通大学讲授的《强化学习》课程课件(2022 年版本)。
我们提供了两个版本的课件,一是 PDF 格式,可以直接在下面的列表中点击打开下载;另一种是 PPT 格式,可以帮助老师们备课使用,如有需要,填写完问卷可立即进行下载。
强化学习简介
马尔可夫决策过程
值函数估计
无模型控制
规划与学习
近似逼近方法
深度强化学习价值方法
深度强化学习策略方法
基于模型的深度强化学习
模仿学习
离线强化学习
参数化行动空间
目标导向的强化学习
多智能体强化学习
决策智能大模型(英文)
附:强化学习部分定理证明
附:3 小时强化学习基础课件