赞
踩
1、agent就是能够行动的某种东西。
2、合理agent:当存在不确定性时,能够实现最佳期望结果而行动的agent
3、agent可以抽象地表示成方程:搜集信息,处理信息,行动
4、agent相当于与环境相互感知的对象,通过感知器感知环境序列并转化为行为,再通过执行器产生对环境的影响(感知器+执行器+之间的映射函数)
5、感知器(sensors)感知环境信息给agent,通过faction处理信息转化为行为给执行器(actuartors)反馈信息给环境
6、agent函数将任何感知历史数据映射为行为,agent程序通过物理系统上运行来实现agent函数,agent=体系结构(sensor+actor)+程序,即软件和硬件
7、agent程序:
a、以传感器得到的当前感知信息为输入
b、以执行器的行为为输出
c、仅仅以当前感知为输入而不是整个历史感知为输入
8、理性agent:对于每一个可能的感知数据序列,一个理性的agent应该采取一个行为已达到最大的性能,即必须是agent+产生最大性能
a、一个agent应该根据他感知的信息产生一个行为
b、给行为是正确的,也就是说能产生最大的性能
9、理性判断的四个因素:先验知识,可以完成的行动,截止到此刻的感知序列,性能度量
a、训练集数据是提供先验知识的东西
b、训练出来的模型是agent程序
10、agent四种类型:简单反射,基于模型,基于目标,基于效用,依次递进,环境越来越复杂
11、简单反射agent:基于当前的感知选择行动,不关注历史信息;当前状态+当前感知(仅考虑前车刹车灯的刹车问题)
12、基于模型的反射agent:agent根据感知历史维持内部状态,agent随时更新内部状态信息;当前状态=当前感知+上一时刻状态(+上一时刻行动)(在上问题的基础上考虑了距离前车距离的刹车问题)
13、基于目标的agent:除了根据感知信息以外还有根据目标采取行动;当前行动=当前状态+当前目标。效率低,需要推理(在上问题的基础上考虑了路况<十字路口>和行驶计划的刹车问题)
14、基于效用的agent:当达到目标的行为有很多种的时候,还需要考虑效率,相当于决定行为时加入效用衡量因素
15、学习agent:有评价和创新功能的agent,即一个可以学习和修改权值的agent。四个组件(critic、learning element、performance element、problem generator<给建议,给一个创新的方案>)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。