当前位置:   article > 正文

机器智能-高频问题:agent类型_反射agent

反射agent

1、agent就是能够行动的某种东西。

2、合理agent:当存在不确定性时,能够实现最佳期望结果而行动的agent

3、agent可以抽象地表示成方程:搜集信息,处理信息,行动

4、agent相当于与环境相互感知的对象,通过感知器感知环境序列并转化为行为,再通过执行器产生对环境的影响(感知器+执行器+之间的映射函数)

5、感知器(sensors)感知环境信息给agent,通过faction处理信息转化为行为给执行器(actuartors)反馈信息给环境

6、agent函数将任何感知历史数据映射为行为,agent程序通过物理系统上运行来实现agent函数,agent=体系结构(sensor+actor)+程序,即软件和硬件

7、agent程序:
a、以传感器得到的当前感知信息为输入
b、以执行器的行为为输出
c、仅仅以当前感知为输入而不是整个历史感知为输入

8、理性agent:对于每一个可能的感知数据序列,一个理性的agent应该采取一个行为已达到最大的性能,即必须是agent+产生最大性能
a、一个agent应该根据他感知的信息产生一个行为
b、给行为是正确的,也就是说能产生最大的性能

9、理性判断的四个因素:先验知识,可以完成的行动,截止到此刻的感知序列,性能度量
a、训练集数据是提供先验知识的东西
b、训练出来的模型是agent程序

10、agent四种类型:简单反射,基于模型,基于目标,基于效用,依次递进,环境越来越复杂

11、简单反射agent:基于当前的感知选择行动,不关注历史信息;当前状态+当前感知(仅考虑前车刹车灯的刹车问题)

12、基于模型的反射agent:agent根据感知历史维持内部状态,agent随时更新内部状态信息;当前状态=当前感知+上一时刻状态(+上一时刻行动)(在上问题的基础上考虑了距离前车距离的刹车问题)

13、基于目标的agent:除了根据感知信息以外还有根据目标采取行动;当前行动=当前状态+当前目标。效率低,需要推理(在上问题的基础上考虑了路况<十字路口>和行驶计划的刹车问题)

14、基于效用的agent:当达到目标的行为有很多种的时候,还需要考虑效率,相当于决定行为时加入效用衡量因素

15、学习agent:有评价和创新功能的agent,即一个可以学习和修改权值的agent。四个组件(critic、learning element、performance element、problem generator<给建议,给一个创新的方案>)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/907995
推荐阅读
相关标签
  

闽ICP备14008679号