赞
踩
基本RAG需要从外部知识数据库中获取文档,然后,将这些文档与用户的查询一起被传输到LLM,用于生成响应。从本质上讲,RAG包括一个检索组件、一个外部知识数据库和一个生成组件。
在基本的RAG场景中,大致有如下步骤:首先将文本划分为多个块,使用Transformer Encoder模型将这些块嵌入到向量中,将这些向量存储到向量数据库并建立索引,查询会检索向量数据库中相关的上下文,这些上下文和查询一起生成最终的LLM提示,并引导LLM合成响应。
RAG系统包含三个关键模块:
Retriever:从上下文相关的知识源中检索文本段落;
Reranker(可选):对检索到的段落重新打分和重新排序;
Generator:将上下文与检索到的段落集成以生成输出文本
最基本、最简单的RAG系统有时候会检索不到相关的上下文,因此需要一些更高级的方法来增强RAG系统,比如:查询转换、重排序等。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。