课件

本页面提供张伟楠老师在上海交通大学讲授的《强化学习》课程课件(2022 年版本)。

我们提供了两个版本的课件,一是 PDF 格式,可以直接在下面的列表中点击打开下载;另一种是 PPT 格式,可以帮助老师们备课使用,如有需要,填写完问卷可立即进行下载。

  1. 强化学习简介

  2. 马尔可夫决策过程

  3. 值函数估计

  4. 无模型控制

  5. 规划与学习

  6. 近似逼近方法

  7. 深度强化学习价值方法

  8. 深度强化学习策略方法

  9. 基于模型的深度强化学习

  10. 模仿学习

  11. 离线强化学习

  12. 参数化行动空间

  13. 目标导向的强化学习

  14. 多智能体强化学习

  15. 决策智能大模型(英文)

  16. 附:强化学习部分定理证明

  17. 附:3 小时强化学习基础课件