当前位置:   article > 正文

LLM之RAG理论(六)| 高级RAG指南和技巧_langchain huggingface rag

langchain huggingface rag

一、基本RAG介绍

       基本RAG需要从外部知识数据库中获取文档,然后,将这些文档与用户的查询一起被传输到LLM,用于生成响应。从本质上讲,RAG包括一个检索组件、一个外部知识数据库和一个生成组件。

       在基本的RAG场景中,大致有如下步骤:首先将文本划分为多个块,使用Transformer Encoder模型将这些块嵌入到向量中,将这些向量存储到向量数据库并建立索引,查询会检索向量数据库中相关的上下文,这些上下文和查询一起生成最终的LLM提示,并引导LLM合成响应。

RAG系统包含三个关键模块:

Retriever:从上下文相关的知识源中检索文本段落;

Reranker(可选):对检索到的段落重新打分和重新排序;

Generator:将上下文与检索到的段落集成以生成输出文本

二、使用LangChain和Huggingface实现基本RAG

三、高级RAG

       最基本、最简单的RAG系统有时候会检索不到相关的上下文,因此需要一些更高级的方法来增强RAG系统,比如:查询转换、重排序等。

3.1 高级RAG(检索增强生成)技术涵盖以下内容:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/153132
推荐阅读
相关标签