当前位置:   article > 正文

AI Agent(人工智能体) 初步认识_人工智能中agent流程梳理工作叫什么

人工智能中agent流程梳理工作叫什么

什么是AI Agent(人工智能体)

AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。

简单说,AI聊天机器人主要靠“说”来回答你的问题,而AI Agent则会“动”起来完成具体的任务,就像人类助理一样,在你忙不过来的时候替你完成一些工作,区别就是用AI来驱动而不是人脑驱动。

从原理上说,AI Agent的核心驱动力是大模型,在此基础上增加规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。

智能体结构概述


 

在 LLM 支持的自主智能体系统中,LLM 充当智能体的大脑,并由几个关键组件进行补充:

规划(Planing)
子目标和分解(Subgoal and decomposition):代理将大型任务分解为更小的、可管理的子目标,从而能够有效地处理复杂的任务。
反思和完善(Reflection and refinement):智能体可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。
记忆 (Memory)
短期记忆(Short-term memory):我认为所有的上下文学习(参见提示工程)都是利用模型的短期记忆来学习。
长期记忆(Long-term memory):这为代理提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索。
工具使用(Tools use)
代理学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

智能体用到的关键技术

1. 大语言模型:充当智能体的大脑做决策和推理.

2. Function Calling:

一个重大挑战:处理人工智能模型返回的非结构化文本数据。

传统的解决方案,从模型输出中提取结构化数据(如 JSON)需要复杂的提示工程(Prompt)或正则表达式 (RegEx),由于 AI 模型的不可预测性和用户输入的可变性,这可能容易出错且不一致。

现在的方案:为了解决这个问题,OpenAI推出了两项创新功能:Json模式和函数调用(Function Calling)。本文将深入研究函数调用功能,说明它如何简化从模型输出中提取结构化数据的过程,并辅以 TypeScript 代码示例。

3. 可调度的工具(Tools)

4. Vector Store 向量存储

OpenAI Function Calling工作的流程

根据OpenAI的文档,函数调用的基本步骤顺序如下:

1. 使用用户查询和函数(工具)参数中定义的一组函数来调用模型。
2. 模型可以选择调用一个或多个函数;如果是这样,内容将是一个符合您的自定义架构的字符串化 JSON 对象(注意:模型可能会产生参数)。
3. 在代码中将字符串解析为 JSON,并使用提供的参数(如果存在)调用函数。
4. 通过将函数响应作为新消息附加来再次调用模型,并让模型将结果汇总返回给用户。

参考资料

LLM Powered Autonomous Agents | Lil'Log

GPT之后下一个热点!硅谷大佬为啥追捧AI Agent? _ 东方财富网

https://towardsdatascience.com/create-an-agent-with-openai-function-calling-capabilities-ad52122c3d12

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/780701
推荐阅读
相关标签
  

闽ICP备14008679号