轻松解决TSP问题之强化学习（BaseLine）_强化学习任务分配,对比算法baseline

作者：我家小花儿 | 2024-06-19 03:39:18

踩

强化学习任务分配,对比算法baseline

前言

以前压箱底的东西
由于这个时间关系（好吧其实是我懒），咱们的话就只写了这个最简单的一个BaseLine版本。那么后面还有Lite,Plus版本，区别的话就是神经网络模型的一个区别，其他的思想都是一样的。那么为什么不写后面的版本呢，一方面是懒，另一方面是，这样搞，我后面怎么水呀。而且一步到位的话，这个阅读量还是挺大的。那么后续的版本什么时候更新呢，这个不急，而且改进的点也很简单。

那么本文也是，TSP系列的第三篇文章，也是作为一个拓展文章，那么关于原理部分的话，这里就不细说了，需要一定的基础进行观看。

强化学习

那么咱们这边所使用到的强化学习算法呢还是这个DDPG，为什么用这个，待会在模型阐述的时候我会进行说明。那么咱们这边简单聊一下DDPG，之后的话结合到我们具体的TSP求解当中。

强化学习

强化学习是机器学习领域之一，受到行为心理学的启发，主要关注智能体如何在环境中采取不同的行动，以最大限度地提高累积奖励。

在这里插入图片描述

关键概念

关于强化学习这里面主要有几个概念。

智能体

强化学习的本体，作为学习者或者决策者。

环境

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家小花儿/article/detail/735236

轻松解决TSP问题之强化学习（BaseLine）_强化学习任务分配,对比算法baseline

文章目录

前言

强化学习

强化学习

关键概念