赞
踩
AI Agent火爆到什么程度?
OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent
;比尔·盖茨在2023年曾预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业
;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。
Agent 是未来最重要的智能化工具。对于程序员来说,是时候将目光转向大模型的应用开发了,率先抢占AI的下一个风口AI Agent
。
今天,带来一本新书《大模型应用开发 动手做 AI Agent》,从0到1手把手教你做AI Agent。
有这样一本秘籍在手,程序员们这下放心了吧,让我们先来揭开 Agent 的神秘面纱。
先对 Agent 下一个定义:Agent 是一个具有一定程度自主性的人工智能系统。更进一步说,Agent 是一个能够感知环境、做出决策并采取行动的系统。
Agent 具有四大特性:
自主性:Agent 能够根据自身的知识和经验,独立做出决策和采取行动。
适应性:Agent 能够学习和适应环境,不断提高自己的能力。
交互性:Agent 能够与人类进行交互,提供信息和服务。
功能性:Agent 可以在特定领域内执行特定的任务。
要从技术上实现上述特性,Agent 通常需要包含四大核心组件。感知器用来收集环境信息;知识库存储和管理有关环境和自身状态的信息;决策引擎分析感知的信息,做出决策;执行器在环境中采取行动。
那么,我们在开发 Agent 时要遵循哪些原则才能收效最佳呢?本书作者引据儒家经典的“博学之,审问之,慎思之,明辨之,笃行之”。 在经过引申之后,为我们阐述了 Agent 方法论。
博学:海纳百川,基于海量数据的训练。
审问:接受清晰明确的指令,即有效的提示工程。
慎思:在精巧设计的模式下认知,配置 CoT、ToT、ReAct 等思维框架。
明辨:明确地遵循人类道德规范,通过指令微调和价值对齐来确保AI安全无害。
笃行:借助 ToolCalls 和 Function Calling 等技术工具与外界交互。
将传统文化中的哲理与现代科技前沿结合,碰撞出智慧的火花,这对处于萌芽阶段的 Agent 技术来说,是十分珍贵的思考。Agent 市场潜力巨大,但目前相关技术资料分散,本书将多项 AI 技术和工具整合到一起,为 Agent 开发提供系统性指导。
对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。
本书按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。
基础知识
这部分先是定义了 Agent 的概念,然后说明大模型对于 Agent 的重要程度如同大脑,这是 Agent 进行理解和决策的基础。还对 Agent 的四大特性与四大核心组件进行介绍。
书中提到 Agent 可用于自动化办公、客户服务、个性化推荐、医疗保健等领域,将会带来新的商业模式和变革。
技术工具
书中介绍了 Agent 架构的四大要素,分别是规划、记忆、工具、执行。重点介绍了当前流行的 ReAct 框架。详细说明了以下技术工具的使用方法。
OpenAI API 以及 OpenAI Assistants:用于调用包含 GPT-4 模型 和 DALL·E 3
模型在内的众多人工智能模型。LangChain:开源框架,专门用于构建和开发由大型语言模型驱动的应用程序,其中包含对 ReAct 框架的封装和实现。
LlamaIndex:开源框架,用于帮助管理和检索非结构化数据,利用大模型的能力和 Agent
框架来提高文本检索的准确性、效率和智能程度。
Agent 通过接口连接大模型,获得生成内容、语言理解、决策支持能力,再通过外部工具执行复杂任务,或者与环境交互。
项目实战
工具都会用之后,这部分要讲的就是怎样做出成功的应用,书中详细解析了 7 个项目的实战。
Agent 1:自动化办公项目,通过 Assistants API 和 DALL·E 3 模型创作 PPT。
Agent 2:多功能选择的引擎,通过 Function Calling 调用函数。
Agent 3:推理与行动的协同,通过 LangChain 中的 ReAct 框架实现自动定价。
Agent 4:计划和执行的解耦,通过 LangChain 中的 Play-and-Execute 实现智能调度库存。
Agent 5:知识的提取与整合,通过 LlamaIndex 实现检索增强生成 Agent。
Agent 6:GitHub 的网红聚落,AutoGPT、BabyAGI 和 CAMEL。
Agent 7:多 Agent 框架,AutoGen 和 MetaGPT。
本书兼具理论与实践,读者可以轻松入门,快速掌握 AI Agent 的开发方法。
自从 ChatGPT 诞生以来,大模型技术在业界可谓炙手可热,人们从最初的惊叹到现在广泛应用,而人工智能的下一个引爆点很有可能就是 AI Agent。
《大模型应用开发:动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
保证100%免费
】Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。