当前位置:   article > 正文

基于深度强化学习的路径规划笔记_深度学习路径规划

深度学习路径规划
MazePathFinder using deep Q Networks

声明:首先感谢知乎周思雨博主;此方法同源借鉴于ICIA一篇强化学习paper,本博主于2019年元月还原了此方法,由于近期在撰写毕业论文,结合本人的理解创作了此篇博客!感兴趣者欢迎随时留言与我讨论
邮箱adamlouisky@gmail.com(1584622065@qq.com)
感谢!

该程序将由几个封锁(由块颜色表示)组成的图像作为输入,起始点由蓝色表示,目的地由绿色表示。 它输出一个由输入到输出的可能路径之一组成的图像。 下面显示的是程序的输入和输出。
在这里插入图片描述

在这里插入图片描述

输入图像被馈送到由2个conv和2个fc层组成的模型,其输出对应于底部和右侧动作的Q值。 代理根据哪个Q值更大而向右或向下移动,并且使用代理的新位置生成的相应新图像再次被馈送到模型。获得输出状态并反馈新图像的过程保持重复 直到代理到达到达目的地的终端阶段。

总体思路:

获取image(map)
Agent处理image
Mobile Robot得到向前还是向右的指令
实现

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/293010
推荐阅读
相关标签
  

闽ICP备14008679号