当前位置:   article > 正文

轻松解决TSP问题之强化学习(BaseLine)_强化学习任务分配,对比算法baseline

强化学习任务分配,对比算法baseline

前言

以前压箱底的东西
由于这个时间关系(好吧其实是我懒),咱们的话就只写了这个最简单的一个BaseLine版本。那么后面还有Lite,Plus版本,区别的话就是神经网络模型的一个区别,其他的思想都是一样的。那么为什么不写后面的版本呢,一方面是懒,另一方面是,这样搞,我后面怎么水呀。而且一步到位的话,这个阅读量还是挺大的。那么后续的版本什么时候更新呢,这个不急,而且改进的点也很简单。

那么本文也是,TSP系列的第三篇文章,也是作为一个拓展文章,那么关于原理部分的话,这里就不细说了,需要一定的基础进行观看。

强化学习

那么咱们这边所使用到的强化学习算法呢还是这个DDPG,为什么用这个,待会在模型阐述的时候我会进行说明。那么咱们这边简单聊一下DDPG,之后的话结合到我们具体的TSP求解当中。

强化学习

强化学习是机器学习领域之一,受到行为心理学的启发,主要关注智能体如何在环境中采取不同的行动,以最大限度地提高累积奖励。

在这里插入图片描述

关键概念

关于强化学习这里面主要有几个概念。

智能体

强化学习的本体,作为学习者或者决策者。

环境

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/735236
推荐阅读
相关标签
  

闽ICP备14008679号