赞
踩
以前压箱底的东西
由于这个时间关系(好吧其实是我懒),咱们的话就只写了这个最简单的一个BaseLine版本。那么后面还有Lite,Plus版本,区别的话就是神经网络模型的一个区别,其他的思想都是一样的。那么为什么不写后面的版本呢,一方面是懒,另一方面是,这样搞,我后面怎么水呀。而且一步到位的话,这个阅读量还是挺大的。那么后续的版本什么时候更新呢,这个不急,而且改进的点也很简单。
那么本文也是,TSP系列的第三篇文章,也是作为一个拓展文章,那么关于原理部分的话,这里就不细说了,需要一定的基础进行观看。
那么咱们这边所使用到的强化学习算法呢还是这个DDPG,为什么用这个,待会在模型阐述的时候我会进行说明。那么咱们这边简单聊一下DDPG,之后的话结合到我们具体的TSP求解当中。
强化学习是机器学习领域之一,受到行为心理学的启发,主要关注智能体如何在环境中采取不同的行动,以最大限度地提高累积奖励。
关于强化学习这里面主要有几个概念。
智能体
强化学习的本体,作为学习者或者决策者。
环境
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。