当前位置:   article > 正文

人工智能学习笔记(一)---Agent和搜索_基于模型的反射agent

基于模型的反射agent

目录

一、Agent

Agent和环境

理性Agent

Agent的类型和结构

二、搜索策略

三、超越经典搜索(模拟退火、遗传算法)

模拟退火

基本思想

相关概念

具体算法步骤解析

算法优缺点

遗传算法(GA)

基本思想

具体步骤解析

优缺点和应用


一、Agent

Agent和环境

任务环境的规范描述:

PEAS(Performance(性能),Environment(环境),Actuators(执行器),Sensors(传感器))

理性Agent

理性的Agent就是做事正确的Agent,对每一个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性的Agent应该选择能使其性能度量最大化的行动环境的性质

理性不等同于全知(已知的知识都是有限的)

理性不等于完美:因为同样的Agent在不同的环境下就会变成非理性的

理性是使期望的性能最大化

完美是使实际的性能最大化

Agent的类型和结构

四种基本的类型

①简单反射agent 基于当前的感知选择行动,不关注感知历史

②基于模型的反射agent   

Agent根据感知历史维持内部状态,Agent随时更新内部状态信息

③基于目标的agent

除了根据感知信息之外,还要根据目标信息来选择行动

效率比较低,需要推理

搜索和规划算法

④基于效用的agent

当达到目标的行为有很多种的时候,需要考虑效率

环境是部分可观察的和随机的,不确定下的决策过程可以通过基于效用的agent来实现。

效用的作用

多目标相冲突时

多目标在不确定环境中

一个目标有多种行为可以达到时

⑤学习agent

  • 4个组件
    • 性能元件:相当于整个a
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/295304
推荐阅读
相关标签
  

闽ICP备14008679号