Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Fudan University

深度强化学习导论

Fudan University via XuetangX

Overview

课程从强化学习的起源开始,首先介绍强化学习的特点、基本概念,以及常用的应用场景。然后重点介绍强化学习、深度强化学习的典型算法。并通过一些典型的案例进行解释和练习。


  • 第1模块概述强化学习的基本概念,包括agent(智能体)、环境及其之间的关系,还涵盖了奖励函数、折扣奖励(discounted rewards)、价值函数和优势函数(advantage functions)、Bellman方程等内容。其中Bellman方程式整个深度强化学习的基础。

  • 第2模块介绍时序差分、SARSA与Q-Learning等经典算法,还以经典的迷宫游戏问题为例说明。

  • 第3模块介绍深度Q网络、深度强化学习算法DQN、经验回放(buffer replay)、Double DQN(DDQN)、竞争网络结构Dueling Network、策略网络(policy network)、actor-critic、A3C算法等基本的深度强化学习算法。

  • 第4模块介绍TRPO、PPO等高级深度强化学习算法。

  • 第5模块讨论新闻推荐、基金定投策略、道路裂缝检测等典型案例。

  • 最后结课测试。

Syllabus

  • 第一单元 强化学习基础
    • 第二单元 强化学习基本概念
      • 2.1 强化学习概述
      • 2.2 强化学习入门
      • 2.3 马尔科夫过程和贝尔曼方程
    • 第三单元 深度强化学习常用算法
      • 3.1 算法概述
      • 3.2 强化学习基本算法
      • 3.3 深度强化学习常用算法
    • 第四单元 深度强化学习应用
      • 第五单元 高级强化学习算法
        • 5.1 TRPO算法
        • 5.2 PPO算法
      • 深度强化学习导论结课

        Taught by

        Weidong Zhao

        Tags

        Reviews

        Start your review of 深度强化学习导论

        Never Stop Learning.

        Get personalized course recommendations, track subjects and courses with reminders, and more.

        Someone learning on their laptop while sitting on the floor.