AI学习01 《强化学习》学习笔记-第一章强化学习概述_ai强化学习

作者：煮酒与君饮 | 2024-06-23 18:48:14

踩

ai强化学习

本篇仅记录学习笔记。

强化学习方法起源于动物心理学的相关原理，模仿人类和动物学习的试错机制，是一种通过与环境交互，学习状态到行为的映射关系，以获得最大累积期望汇报的方法。

1 强化学习的主要组成

强化学习、监督学习与非监督学习

机器学习实际上有三大分类：监督学习、非监督学习和强化学习。

根据是否建立环境动力学的模型划分为模型方法和无模型方法。

根据不同的估计方法可以把强化学习方法分为基于值函数的方法、基于策略的方法和行动者-评论家方法。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/煮酒与君饮/article/detail/750347