赞
踩
强化学习就是把行为的学习看成反复试验或试错(Trial and Error)的过程,从而形成对动作的映射,以便对每个特定的环境都会产生一个适当的动作。
具有学习能力的机器称之为Agent。
从广义上讲,与Agent交互的物体,包括Agent之外的一切都被称为环境。
Agent与环境之间的相互作用是一个持续的过程。
强化学习定义:所谓强化学习就是Agent从环境到行为映射的学习,以使奖励信号函数(强化信号)最大。
①Agent感知环境的状态,其中S为可能状态的集合;
②Agent基于感知的状态,根据某种策略选择一个动作,(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。