爱喝兽奶帝天荒

这个屌丝很懒，什么也没留下！

热门标签

三、茴香豆：搭建你的 RAG 智能助理_rag包含native rag?

作者：爱喝兽奶帝天荒 | 2024-07-29 17:49:01

踩

rag包含native rag?

茴香豆是一款新的应用，由于没有使用相关的资料去训练模型，原始的InternLM2-Chat-7B模型便无法回答相关问题、胡编乱造

RAG很好地解决了上述问题，无需额外训练。其最大的特点是解决大模型处理知识密集任务时的各种挑战。

通过余弦相似度或点乘来判断向量之间的相似度，然后根据相似度的排分进行结果的排序，把最相关的内容用于后续回答的生成。

在面向大规模的数据以及需要高速响应的需求时，向量数据库也是需要优化的，其中非常重要的是对向量表示的优化，例如使用更高级的文本编码技术、更好的预训练模型，也包括尝试不同的句子、段落嵌入

Indexing（索引） Retrieval（检索） embeddings（嵌入） Chunks Vectors（向量数据库）

RAG无需训练，只需更新向量数据库即可

Native RAG：索引、检索、生成三个基础部分

Advanced RAG：在三个基础部分（索引、检索、生成）之外，对检索前后都进行增强，在检索之前对用户的问题进行路由扩展、重写等，对检索到的信息进行重排序、总结融合等处理，使信息处理和收集能力更高

Modular RAG：将RAG的基础部分和后续各种优化技术及功能模块化，可以根据实际业务需求定制，完成如图中更高级的应用

嵌入优化、索引优化：这两种方法通过提高向量数据库的质量，来对RAG进行性能的提升

上下文管理：通过如图中的方法减少检索的冗余信息，并提高大模型的处理效率。如可以使用小一点的语言模型，来检测和移除不重要的标记，或者训练信息提取器和压缩器

查询优化、上下文管理：advice中RAG前检索后检索部分

迭代检索：为大模型生成提供全面的知识基础

递归检索：通过迭代细化搜索查询来改进搜索结果的深度和相关性，使用链式推理指导检索过程并根据检索结果细化推理过程

自适应检索：让大模型能够自主的决定其所要检索的内容

迭代检索、递归检索、自适应检索：retrieval检索部分是优化中的重中之重

LLM微调：优化RAG一种常见的思路，可根据场景和数据特征，对大模型进行定向微调；对模型生成和参与进行针对性微调。

提示工程（不建议）

其应答模块采用多来源检索、混合检索、安全评估来保证输出内容的准确性

其综合多来源检索到的信息，通过评分来控制内容筛选，方便控制输出内容的严谨性

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/899990