基于深度强化学习的路径规划笔记_深度学习路径规划

作者：Monodyee | 2024-03-23 03:54:23

踩

深度学习路径规划

该程序将由几个封锁（由块颜色表示）组成的图像作为输入，起始点由蓝色表示，目的地由绿色表示。它输出一个由输入到输出的可能路径之一组成的图像。下面显示的是程序的输入和输出。
在这里插入图片描述

在这里插入图片描述

输入图像被馈送到由2个conv和2个fc层组成的模型，其输出对应于底部和右侧动作的Q值。代理根据哪个Q值更大而向右或向下移动，并且使用代理的新位置生成的相应新图像再次被馈送到模型。获得输出状态并反馈新图像的过程保持重复直到代理到达到达目的地的终端阶段。

总体思路：

获取image（map）
Agent处理image
Mobile Robot得到向前还是向右的指令
实现

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/293010