赞
踩
在人工智能中,智能代理AI Agent是以智能方式行事的代理;它感知环境,自主采取行动以实现目标,并可以通过学习或获取知识来提高其性能。人其实就是一种复杂代理。
为了理解智能代理的结构,我们应该熟悉架构和代理程序。架构是代理执行的机器,它是一种带有传感器和执行器的设备,例如机器人;代理程序是代理功能的实现。代理函数是从感知序列(代理迄今为止感知的所有历史记录)到动作的映射:
Agent = 架构 + Agent 程序
代理通过两种方式与环境交互:
生成式人工智能代理感知环境并将它们带到内存流,在那里它们可以存储数据。根据其知识,它获取选定的数据(检索的记忆),这有助于确定它将决定的行动计划。其主要部分包括:
人工智能代理的一些现实例子展示了人工智能的多样化应用,包括自然语言处理和机器人技术。通过探索这些示例,您可以更深入地了解人工智能如何改变行业并改善我们的日常生活:
应用
简单的反射代理是一个遵循预定义规则做出决策的人工智能系统。它仅对当前情况做出反应,而不考虑过去或未来的影响。
简单的反射代理适用于具有稳定规则和直接操作的环境,因为它的行为纯粹是反应性的,并且对即时环境变化做出响应。
简单的反射代理通过遵循条件动作规则来执行其功能,该规则指定在特定条件下采取什么动作。
为支持自动化客户支持交互而开发的基于规则的系统。如果客户的消息包含指示密码重置的关键字,系统可以自动生成包含重置密码说明的预定义响应。
以下是简单反射代理的局限性:
基于模型的反射根据当前感知和表示不可观察单词的内部状态来执行操作。它根据两个因素更新其内部状态:
谨慎的基于模型的反射代理是基于模型的反射代理的变体,它在执行操作之前也会考虑其操作可能产生的后果。
基于模型的反射代理遵循条件操作规则,该规则指定在给定情况下要采取的适当操作。但与简单的反射代理不同,基于模型的代理还利用其内部状态来评估决策和行动过程中的状况。
基于模型的反射代理分四个阶段运行:
Amazon Bedrock是基于模型的反射代理的最佳示例之一。
Amazon Bedrock 是一项使用基础模型来模拟操作、获取见解并做出明智决策以进行有效规划和优化的服务。
通过依靠各种模型,Bedrock 获得洞察、预测结果并做出明智的决策。它利用真实世界的数据不断完善其模型,使其能够适应和优化其运营。
然后,Amazon Bedrock 针对不同的场景进行规划,并通过模拟和调整模型参数来选择最佳策略。
基于目标的代理是使用环境中的信息来实现特定目标的人工智能代理。他们使用搜索算法来寻找在给定环境中实现其目标的最有效路径。
这些代理也称为基于规则的代理,因为它们遵循预定义的规则来实现其目标并根据某些条件采取特定操作。
基于目标的代理易于设计并且可以处理复杂的任务。它们可用于机器人、计算机视觉和自然语言处理等各种应用。
与基本模型不同,基于目标的代理可以根据其期望的结果或目标确定决策和采取行动过程的最佳过程。
给定一个计划,基于目标的智能体尝试选择实现目标的最佳策略,然后使用搜索算法和启发式方法找到实现目标的有效路径。
基于目标的Agent的工作模式可以分为五个步骤:
我们可以说Google Bard是一个基于目标的代理。毫无疑问,它也是一个学习代理。
作为基于目标的代理,它的目标或目的是为用户查询提供高质量的响应。它选择可能帮助用户找到他们寻求的信息并实现获得准确和有用的响应的预期目标的操作。
基于效用的代理是基于效用函数或价值最大化做出决策的人工智能代理。他们选择预期效用最高的行动,该效用衡量结果的好坏。
这有助于他们更加灵活和适应性地处理复杂和不确定的情况。基于实用程序的代理通常用于必须在多个选项之间进行比较和选择的应用程序,例如资源分配、调度和玩游戏。
基于效用的代理旨在选择导致高效用状态的操作。为了实现这一点,它需要对其环境进行建模,该环境可以是简单的也可以是复杂的。
然后,它根据概率分布和效用函数评估每个可能结果的预期效用。
最后,它选择具有最高预期效用的操作,并在每个时间步重复此过程。
Anthropic Claude是一种人工智能工具,其目标是帮助持卡会员最大限度地提高使用卡的奖励和利益,是一种基于实用程序的代理。
因为为了实现其目标,它使用效用函数将代表成功或幸福的数值分配给不同的状态(持卡人面临的情况,例如购物、支付账单、兑换奖励等)。然后比较每个状态下不同行动的结果,并根据其效用值做出权衡决策。
此外,它还使用启发式和人工智能技术来简化和改进决策。
AI学习代理是一种软件代理,可以从过去的经验中学习并提高其性能。它最初使用基础知识进行操作,并通过机器学习自动适应。
学习代理包含四个主要组件:
人工智能学习代理遵循观察、学习和基于反馈采取行动的循环。他们与环境互动,从反馈中学习,并修改自己的行为以适应未来的互动。
该循环的工作原理如下:
这个循环随着时间的推移不断重复,使代理能够不断提高其性能并适应不断变化的环境。
学习代理程序的一个很好的例子是由 Significant Gravitas 创建的 AutoGPT。
想象一下您想购买一部智能手机。因此,您提示AutoGPT对排名前十的智能手机进行市场研究,提供有关其优缺点的见解。
一旦完成这项任务,AutoGPT 就会通过探索各种网站和来源来分析排名前十的智能手机的优缺点。它使用子代理程序评估网站的真实性。最后,它生成一份详细的报告,总结调查结果并列出十大智能手机公司的优缺点。
分层代理按层次结构构建,高级代理监督较低级别的代理。但是,级别可能会根据系统的复杂性而有所不同。
分层代理可用于各种应用,例如机器人、制造和运输。他们擅长协调多项任务和子任务并确定优先级。
层级代理的工作方式就像公司组织一样。他们以由不同级别组成的结构化层次结构来组织任务,其中较高级别的代理监督目标并将其分解为更小的任务。
随后,较低级别的代理执行这些任务并提供进度报告。
在复杂系统的情况下,可能存在中间级别的代理来协调较低级别代理与较高级别代理的活动。
UniPi是 Google 推出的一款创新的分层人工智能代理,它利用文本和视频作为通用界面,使其能够在各种环境中学习各种任务。
UniPi 包含生成指令和演示的高级策略和执行任务的低级策略。高层策略适应各种环境和任务,而低层策略通过模仿和强化学习进行学习。
这种分层设置使 UniPi 能够有效地将高级推理和低级执行结合起来。
人工智能代理是可以使用LLM和工具来执行各种任务和功能的系统。他们可以通过使用外部信息源、计算和验证来克服语言模型的一些限制。他们还可以计划和执行需要多个步骤或子任务的复杂操作。
参考:
1、Agents in Artificial Intelligence | Understanding How Agents Should Act
2、6 Types of AI Agents: Exploring the Future of Intelligent Machines
6、Intelligent Agents that Astound: Generative AI agents - Markovate
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。