DQN入门 - CodingNote.cc

在DQN（Deep Q-learning）入门教程（四）之Q-learning Play Flappy Bird中，我们 …

简介 DQN——Deep Q-learning。在上一篇博客DQN（Deep Q-learning）入门教程（四）之Q- …

在上一篇博客中，我们详细的对Q-learning的算法流程进行了介绍。同时我们使用了\(\epsilon-贪婪法\)防止 …

蒙特卡罗法在介绍Q-learing算法之前，我们还是对蒙特卡罗法（MC）进行一些介绍。MC方法是一种无模型（model …

在上一篇博客：DQN（Deep Q-learning）入门教程（一）之强化学习介绍中有三个很重要的函数：策略：\(\p …

什么是强化学习？强化学习（Reinforcement learning，简称RL）是和监督学习，非监督学习并列的第三种 …

简介 DQN入门系列地址://www.cnblogs.com/xiaohuiduan/category/1770037. …