当前位置:   article > 正文

深度强化学习DDPG算法高性能Pytorch代码(改写自spinningup,低环境依赖,低阅读障碍)_from ddpg.models import

from ddpg.models import

写在前面

  1. DRL各种算法在github上各处都是,例如莫凡的DRL代码ElegantDRL(推荐,易读性NO.1)
  2. 很多代码不是原算法的最佳实现,在具体实现细节上也存在差异,不建议直接用在科研上。
  3. 这篇博客的代码改写自OpenAi spinningup源码DRL_OpenAI代码性能方面不再是你需要考虑的问题了
  4. 为什么改写?因为源码依赖环境过多,新手读起来很吃力,还有很多logger让人头疼。
  5. 这篇博客的代码将环境依赖降低到最小,并且摒弃了一些辅助功能,让代码更容易读懂。
  6. 如果本博客的代码在迁移至你的环境时依旧收敛不了,你的reward或者思路存在问题。

项目分三个文件:main.py , DDPGModel.py , core.py
Python3.6

DDPGModel.py

import numpy as np
from copy 
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/263739?site
推荐阅读
相关标签
  

闽ICP备14008679号