DeepMind-102頁深度強化學習PPT(2019最新)-原理及部分程式碼實現

  • 2019 年 11 月 21 日
  • 筆記

深度強化學習報道

來源自:DeepMind

編輯:DeepRL

完整pdf請看文章末尾

本slide是Namdo de Freitas教授在KHIPU上做強化學習報告的slide, 他於2017年加入DeepMind工作,本文主要涉及了策略梯度、分散式強化學習、PPO、強化學習應用以及Batch強化學習等。

…….

…….

…….

……..

……

……

……..

…….

…….

…….

GitHub倉庫

https://github.com/NeuronDance/DeepRL