检索增强生成 (RAG) 涉及从外部数据库获取当前或上下文相关信息,并在请求大型语言模型 (LLM) 生成响应时将其呈现给大型语言模型 (LLM) 的过程。 这种方法有效地解决了生成不正确或误导性信息的问题。 你能够存储专有业务数据或全局知识,并使你的应用程序能够在响应生成阶段为 LLM 检索此数据。
NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包
LLM 缺乏领域知识,但我们可以通过利用 RAG 从数据库中检索上下文信息并将其与用户输入一起传递给 LLM 并生成丰富的相关响应来填补这一空白。
在本文中,我们将了解如何使用 LangChain 连接到我们的 SQL 数据库、检索上下文信息、将用户查询和上下文一起传递给 LLM 并生成准确的响应。
我们将为职业介绍所构建一个定制的 QA 聊天机器人,帮助用户获取就业市场的相关信息。 用户可能想了解热门职位、特定角色在特定领域的受欢迎程度等。
我们使用 Langchain 作为框架、MySQL 数据库和 OpenAI 的 LLM 来构建我们的应用程序。
pip install langchain langchain-experimental openai pymysql
- from langchain.utilities import SQLDatabase
- from langchain.llms import OpenAI
- from langchain_experimental.sql import SQLDatabaseChain
- from langchain.prompts import PromptTemplate
- from langchain.prompts.chat import HumanMessagePromptTemplate
- from langchain.chat_models import ChatOpenAI
- from langchain.schema import HumanMessage, SystemMessage
- OPENAI_API_KEY = "your-key-here"
- llm = ChatOpenAI(temperature=0, openai_api_key=OPENAI_API_KEY)
我们使用 Langchain 的 ChatOpenAI,它使用 OpenAI 的 gpt3.5-turbo 模型。
- host = 'localhost'
- port = '3306'
- username = 'root'
- password = 'password'
- database_schema = 'agency_db'
- mysql_uri = f"mysql+pymysql://{username}:{password}@{host}:{port}/{database_schema}"
- db = SQLDatabase.from_uri(mysql_uri, include_tables=['job_details'],sample_rows_in_table_info=2)
- db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True)
我们首先构造一个 URI 来连接数据库,这里我使用 pymysql 作为连接 mysql 的驱动程序,但你可以根据你的数据库方言更改它,例如 - postgresql 数据库的连接字符串将与以下完全相同 上面给出的,你只需要将“mysql+pymysql”替换为“postgresql+psycopg2”并通过pip安装psycopg2。
初始化数据库时,我们使用 langchain 中的 SQLDatabase.from_uri()
方法,并传递 URI 和其他一些参数,它们的作用如下:
最后一步是设置一个数据库链,这将帮助我们的 LLM 与数据库交互,我们使用 SQLDatabaseChain 来完成此操作。
- def retrieve_from_db(query: str) -> str:
- db_context = db_chain(query)
- db_context = db_context['result'].strip()
- return db_context
我们将使用提示模板来保持其简洁和易于理解。 提示模板帮助我们构建提示的骨架,我们可以根据用户输入和用例填写模板。
- system_message = """You are a professional representative of an employment agency.
- You have to answer user's queries and provide relevant information to help in their job search.
- Example:
- Input:
- Where are the most number of jobs for an English Teacher in Canada?
- Context:
- The most number of jobs for an English Teacher in Canada is in the following cities:
- 1. Ontario
- 2. British Columbia
- Output:
- The most number of jobs for an English Teacher in Canada is in Toronto and British Columbia
- """
- human_qry_template = HumanMessagePromptTemplate.from_template(
- """Input:
- {human_input}
- Context:
- {db_context}
- Output:
- """
- )
- messages = [
- SystemMessage(content=system_message),
- human_qry_template.format(human_input=query, db_context=db_context)
- ]
- response = chat(messages).content
- def generate(query: str) -> str:
- db_context = retrieve_from_db(query)
- system_message = """You are a professional representative of an employment agency.
- You have to answer user's queries and provide relevant information to help in their job search.
- Example:
- Input:
- Where are the most number of jobs for an English Teacher in Canada?
- Context:
- The most number of jobs for an English Teacher in Canada is in the following cities:
- 1. Ontario
- 2. British Columbia
- Output:
- The most number of jobs for an English Teacher in Canada is in Toronto and British Columbia
- """
- human_qry_template = HumanMessagePromptTemplate.from_template(
- """Input:
- {human_input}
- Context:
- {db_context}
- Output:
- """
- )
- messages = [
- SystemMessage(content=system_message),
- human_qry_template.format(human_input=query, db_context=db_context)
- ]
- response = llm(messages).content
- return response
在本文中,我们探讨了检索增强生成 (RAG) 如何在构建特定领域的聊天机器人时改变游戏规则。 RAG 弥合了大型语言模型 (LLM) 和外部数据库之间的差距,确保做出更明智、更准确的响应。
我们讨论了 RAG 通过从数据库动态检索上下文信息来弥补LLM缺乏领域知识的能力。 实际示例是就业机构的 ChatBot,展示了 Langchain 在连接 SQL 数据库并利用 OpenAI 的 LLM 进行精确响应方面的作用。
通过采用 RAG 和 Langchain 等框架,我们为更多上下文感知的人工智能应用程序铺平了道路。 通过提供准确、上下文丰富的信息,可以实现更好的用户体验和决策。 充分利用 RAG 的潜力,释放数据驱动的对话式 AI 的财富。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。