AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）

作者：代码探险家 | 2024-07-14 22:47:09

踩

文章大纲

GAN 模型与强化学习
- 强化学习
- 生成式对抗网络 ( Generative Adversarial Nets， GAN)
VAE
扩散模型
- 扩散
- 逆扩散
参考文献与学习路径

在这里插入图片描述

GAN 模型与强化学习

强化学习

Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agents ought to take actions in an environment so as to maximize some notion of cumulative reward. （强化学习是机器学习领域之一，受到行为心理学的启发，主要关注智能体如何在环境中采取不同的行动，以最大限度地提高累积奖励。）

强化学习主要由智能体（Agent）、环境（Environment）、状态（State）、动作（Action）、奖励（Reward）组成。智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信号（正奖励或者负奖励）。随后，智能体根据新的状态和环境反馈的奖励，按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。

智能体通过强化学习，可以知道自己在什么状态下，应该采取什么样的动作使得自身获得最大奖励。由于智能体与环境的交互方式与人类与环境的交互方式类似，可以认为强化学习是一套通用的学习框架，可用来解决通用人工智能的问题。因此强化学习也被称为通用人工智能的机器学习方法。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/代码探险家/article/detail/826635

AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程 之 图像、视频生成与视觉大模型）

文章大纲

GAN 模型与强化学习

强化学习

AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）