当前位置:   article > 正文

深度强化学习(Deep Q-learning,DQN)_deep q learning的组成部分

deep q learning的组成部分

参考:教学视频莫烦Python

一,什么是DQN?

学习资料:

强化学习与神经网络

如图显示,主要由DNN+Q-Learning组成。

Q-Learning已经显示了它的强大。由于场景复杂,状态太多,计算机运行有限。DQN就为解决这个而生。

强大的DQN输入输出有两种,第一种,输入状态和动作,输出为Q表。第二种,输入状态,输出动作。

 

分析第二种情况:

 反向传播更新DNN。

使得DQN无比强大的两大原因:第一,Experience replay;第二,Fixed Q-targets;

二,DQN算法更新(using Tensorflow)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/353178
推荐阅读
相关标签
  

闽ICP备14008679号