赞
踩
本书链接:人工智能:一种现代的方法(第3版)
本人人工智能小白,为了恶补知识,所以买了一本综述型的入门教材。终于看完了第一部分,人工智能概述~~做一下笔记,便于后续记忆。
AI的任务是设计Agent程序,实现的是把感知信息映射到行动的Agent函数。
Agent就是能够行动的某种东西,具备自主的操作、感知环境、长期持续、适应变化并能创建与追求目标。
合理Agent是一个为了实现最佳结果,或者,当存在不确定性时,为了实现最佳期望结果而行动的Agent。
智能Agent要采取一个环境中最好的可能行为。
智能主要与理性行为相关。
Agent通过传感器感知环境并通过执行器对所处环境产生影响。
理性Agent是做事正确的Agent。
对每一个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性Agent应该选择能使其性能度量最大化的行动。
尽可能完整地详细说明任务环境。
区分两者的关键在于Agent B 行为的性能度量最大化是否需要依赖于Agent A的行为。
竞争性的多Agent环境
Agent B想要最大化自己的性能度量,就需要最小化Agent A的性能度量。
合作性的多Agent环境
Agent B想要最大化自己的性能度量,就需要最大化Agent A的性能度量。
部分合作部分竞争的多Agent环境
上述两种情况都会发生。
如果环境的下一个状态完全取决于当前状态和Agent执行的动作,则该环境是确定的;否则,是随机的。
不确定与随机的区别
片段式是指 当前决策不会影响到未来的决策。
延续式是指 当前决策会影响到所有未来的决策。
如果环境在Agent计算的时候会变化,该环境是动态的,否则是静态的。
如果环境本身不随时间变化而变化,但Agent的性能评价随时间变化,则环境是半动态的。
离线和连续的使用场景有:
Agent的知识状态。
如果环境是未知的,Agent需要学习环境是如何工作的,以便做出好的决策。
部分可观察的、多Agent的、随机的、延续的、动态的、连续的和未知的环境。
Agent = 体系结构 + 程序。
体系结构:某个具备物理传感器和执行器的计算装置。
体系结构为程序提供来自传感器的感知信息,运行程序,并把程序计算出的行动决策送达执行器。
从传感器得到的当前感知信息
执行器的行动抉择
定义
基于当前的感知选择行动,不关注感知历史。
最简单的Agent类型。
针对完全可观察的环境。
方法
Step 1:首先构建一个通用的条件-行为规则解释器。
Step 2:根据特定任务环境创建相应的规则集合。
缺点
在部分可观察环境中运转的简单反射Agent经常不可避免地陷入无限循环中。
示意图和伪代码见书P44
定义
世界模型:
使用世界模型的Agent称为基于模型的Agent
缺点
部分可观察环境中的Agent不能精准确定当前状态
示意图和伪代码见书P46
这两种情况,通过效用Agent可以解决
负责改进提高
负责选择外部行动,接受感知信息并决策
根据固定的性能指标告诉学习元件Agent的运转情况
负责可以得到新的和有信息的经验的行动提议,建议探索性行动
每个状态是不可见的,没有内部结构
将状态表示为变量或者特征的集合,每个变量或特征都可能有值。
两个不同的要素化表示可以共享一些特征。
描述对象之间的关系
输入:整个感知历史
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。