LangChain大型语言模型(LLM)应用开发(六):Agents_langchain agent

LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,以便在不同的应用程序中使用。
今天我们来学习DeepLearning.AI的在线课程:LangChain for LLM Application Development的第六门课:Agents, 所谓Agents可以理解为那些可以代替你来完成各种任务的人,即代理人(agent)。agent在执行各种任务的时候可能会用到各种工具,那么今天我们就来讨论agent及其工具的使用。


首先我们还是要做一些基础性工作,比如设置openai的api key:

  1. import os
  2. from dotenv import load_dotenv, find_dotenv
  3. _ = load_dotenv(find_dotenv()) # read local .env file
  4. import warnings
  5. warnings.filterwarnings("ignore")



  1. from langchain.agents.agent_toolkits import create_python_agent
  2. from langchain.agents import load_tools, initialize_agent
  3. from langchain.agents import AgentType
  4. from langchain.tools.python.tool import PythonREPLTool
  5. from langchain.python import PythonREPL
  6. from langchain.chat_models import ChatOpenAI
  7. #创建llm
  8. llm = ChatOpenAI(temperature=0)
  9. #定义工具
  10. tools = load_tools(["llm-math","wikipedia"], llm=llm)
  11. #创建代理
  12. agent= initialize_agent(
  13. tools,
  14. llm,
  16. handle_parsing_errors=True,
  17. verbose = True)

这里对上述代码稍加解释,首先我们创建了一个openai的LLM, 接着我们创建了一个工具集tools,该工具集包含了"llm-math"和"wikipedia"这两个工具,最后我们创建了一个代理(agent), 在创建代理时我们将llm 和tools作为参数传递给了代理,我们还设置了代理的类型为AgentType.ZERO_SHOT_REACT_DESCRIPTION,接下来我们来看一下agent的内置prompt模板:







  1. Action: 行动要使用的工具
  2. Action Input: 行动的输入条件
  3. Observation:行动完成后的观察到的结果
  4. Thought: 思考观察到的结果是否满足要求
  5. Final Answer: 最终的答案




Python Agent

前面我们在代理中使用了"llm-math","wikipedia"这两个Langchain内置工具,接下来我们来使用langchain的内置python工具PythonREPLTool,在下面这个例子中我们让agent对一组外国人姓名进行排序,排序的顺序是先last name后 first name:

  1. #创建python agent
  2. agent = create_python_agent(
  3. llm,
  4. tool=PythonREPLTool(),
  5. verbose=True
  6. )
  7. #待排序的customer_list
  8. customer_list = [["Harrison", "Chase"],
  9. ["Lang", "Chain"],
  10. ["Dolly", "Too"],
  11. ["Elle", "Elem"],
  12. ["Geoff","Fusion"],
  13. ["Trance","Former"],
  14. ["Jen","Ayai"]
  15. ]
  16. #对customer_list安last name,first name次序排序
  17. agent.run(f"""Sort these customers by \
  18. last name and then first name \
  19. and print the output: {customer_list}""")

 从上面返回的结果中,Action是 Python_REPL,在Action Input中是一段python代码,也就是说代理通过python工具Python_REPL执行了这段python代码,最后得到了按last name排序的结果。

下面我们来手动执行一下Action Input中的这段代码:

  1. sorted([['Harrison', 'Chase'],
  2. ['Lang', 'Chain'],
  3. ['Dolly', 'Too'],
  4. ['Elle', 'Elem'],
  5. ['Geoff', 'Fusion'],
  6. ['Trance', 'Former'],
  7. ['Jen', 'Ayai']],
  8. key=lambda x: (x[1], x[0]))


 这里我们可以看到Action Input中的这段代码是有效的。


下面我们来查看一下这个python agent在执行的时候所隐藏的细节,只不过我们需要打开langchain的debug功能:

  1. import langchain
  2. langchain.debug=True
  3. agent.run(f"""Sort these customers by \
  4. last name and then first name \
  5. and print the output: {customer_list}""")
  6. langchain.debug=False

 上图是我们截取的部分agent在执行过程中返回的部分细节信息,这里我们注意到细节信息中存在两个prompt, 这也就是说agent访问了两次LLM,我们把两个prompt的内容整理如下:

从上面的第一个prompt可知,我们告知LLM,它是一个执行python代码的代理,它可以通过使用python REPL工具来执行python代码,然后我们告诉LLM必须按照一套流程来完成接下来的任务,这个流程是:Question->Thought->Action->Action Input->Oberservation->Thought->Final Answer,其中 Thought/Action/Action Input/Observation 可以重复N次,在prompt的最后,我们抛出了Question, 最后留下空白的Thought等待LLM来回答。


 从上面的prompt中可知第二个prompt比第一个prompt又向前迈了一步,因为第二个prompt中已经有了Thought, Action 和Action Input三个步骤的内容,接下来就需执行Action Input中的代码,来完成Observation和Thought这两个步骤了。

通过上面的分析可知agent通过两次访问LLM后才完成了这个python编程的任务。其中第一次访问LLM时只是告诉LLM任务的内容是什么(也就是question)以及完成这个任务的基本流程,随后LLM返回了完成任务所需要的python 代码,然后调用python工具Python_REPL来执行代码, 第二次访问LLM时我们已经拿到了所需要的代码,还剩下Observation和Thought的步骤需要完成。最后LLM返回了代码的执行结果,并得到了最后的Final Answer。



前面我们演示的都是Langchain的内置工具,其实我们还可以自定义工具,比如下面我们自定义了一个获取当前日期的函数time, 当我们向LLM询问当前日期的时候,代理都会执行这个自定义的函数:

  1. from langchain.agents import tool
  2. from datetime import date
  3. @tool
  4. def time(text: str) -> str:
  5. """Returns todays date, use this for any \
  6. questions related to knowing todays date. \
  7. The input should always be an empty string, \
  8. and this function will always return todays \
  9. date - any date mathmatics should occur \
  10. outside this function."""
  11. return str(date.today())
  12. agent= initialize_agent(
  13. tools + [time],
  14. llm,
  16. handle_parsing_errors=True,
  17. verbose = True)
  1. try:
  2. result = agent("whats the date today?")
  3. print(result)
  4. except:
  5. print("exception on external access")



  1. # pip install duckduckgo-search
  2. from langchain.tools import DuckDuckGoSearchRun
  3. from langchain.utilities import WikipediaAPIWrapper
  4. from langchain.python import PythonREPL
  5. from langchain.agents import Tool
  6. from langchain.agents import initialize_agent
  7. from langchain.chat_models import ChatOpenAI
  8. import random
  9. llm = ChatOpenAI(temperature=0)
  10. wikipedia = WikipediaAPIWrapper()
  11. search = DuckDuckGoSearchRun()
  12. python_repl = PythonREPL()
  13. #自定义工具,获取随机数
  14. def random_num(input=""):
  15. return random.randint(0,5)
  16. #定义维基百科工具
  17. wikipedia_tool = Tool(
  18. name='wikipedia',
  19. func= wikipedia.run,
  20. description="Useful for when you need to look up a topic, country or person on wikipedia"
  21. )
  22. #定义duckduckgo 搜索工具
  23. duckduckgo_tool = Tool(
  24. name='DuckDuckGo Search',
  25. func= search.run,
  26. description="Useful for when you need to do a search on the internet to find information that another tool can't find. \
  27. be specific with your input."
  28. )
  29. #定义python工具
  30. python_tool = Tool(
  31. name = "python repl",
  32. func=python_repl.run,
  33. description="useful for when you need to use python to answer a question. You should input python code"
  34. )
  35. #定义获取随机数工具
  36. random_tool = Tool(
  37. name='Random number',
  38. func= random_num,
  39. description="Useful for when you need to get a random number. input should be 'random'"
  40. )
  41. #整合所有工具
  42. tools=[python_tool,wikipedia_tool,duckduckgo_tool,random_tool]
  43. #创建代理
  44. zero_shot_agent = initialize_agent(
  46. tools=tools,
  47. llm=llm,
  48. verbose=True,
  49. max_iterations=5,
  50. )



 在上面的模板中分别就4个工具的应用场景做了介绍,它告诉LLM在什么情况下应该使用什么工具,工作流程仍然是:Question->Thought->Action->Action Input->Oberservation->Thought->Final Answer,其中 Thought/Action/Action Input/Observation 可以重复N次,下面我们就用这个多工具的agent来做一下测试:

  1. #给我一个随机数
  2. zero_shot_agent.run("Can you give me a random number?")

  1. #乔.拜登是哪一年出生的
  2. zero_shot_agent.run("When was Joe Biden born?")

  1. #17×6等于几?
  2. zero_shot_agent.run("What is 17*6?")

  1. #苹果公司现在的股票价格是多少?
  2. zero_shot_agent.run('what is the current price of AAPL')


