当前位置:   article > 正文

一文搞懂LlamaIndex开发框架

lamaindex

▼最近直播超级多,预约保你有收获

直播:LlamaIndex架构设计与应用案例实践

 1

LlamaIndex 开发框架剖析 

LlamaIndex 是一个数据开发框架,提供基于 LLM 的应用程序获取、构建和访问私有或特定领域的数据,并通过自然语言建立了和数据源之间的桥梁,数据源可以是企业的 SQL、Excel 等结构化数据,也可以是 Elasticsearch、业务 API 等半结构化数据,更多的是文本、邮件、PDF、PPT、视频、音频、图片等非结构的数据源。

47667e971dd821ea4d497a67b326ba7a.png

对比微服务的业务开发框架 Spring Cloud 和数据代理框架 MyBatis,LangChain 是 AGI 时代的新 Spring Cloud,而 LlamaIndex 是 AGI 时代的MyBatis。

12e9f33b1bbd8d614225ab0b3ed97101.png

我们知道 LLM 通常是在大量公开数据的基础上训练而成,不会包含公司私有数据,所以 LLM 通常无法准确回答私有问题,LlamaIndex 以 RAG (检索增强生成)的落地开发框架,通过私有数据向量化,根据问题内容获取到相关的上下文数据,然后交给 LLM 进行推理回答。

9114d981236c0ff257df4dd20cb734c0.png

LlamanIndex 实现了 RAG 的全部流程,如下所示:

b3b429d7ccd378d0a8acde11681cb3cd.png

Loading step:将存储在不同位置的私有数据(本地文本文件、PDF、其他网站、数据库、 API)以不同的方法获取加载到内存,并通过Llama Hub 提供数百种数据连接器。

c2491401dc8f79392c860b1f78bded6e.png

Indexing step:将数据转换为便于查询的结构化索引,通常是将数据向量化,因为向量化的数据包含了更多维度的语义特征,通过计算相似度可以获取查询问题的上下文信息。

Storing step:将向量化的数据存储到数据库中,便于重复利用,LlamaIndex支持多种向量数据库,比如:Redis,Elasticsearch,Tair 等。

Querying step: 支持多种 LLMs,比如:OpenAI、Llama2、PaLM等,同时支持 huggingface 加载各种语言模型,通过不同的查询策略:路由查询、子查询、分步查询等,根据 index 数据进行回答问题。

    • 路由查询:是指根据问题内容自动选择所需要的数据源。

    • 子查询:是指根据问题生成多个子问题然后自动选择数据源回答,再将多个子问题的回答进行汇总。

    • 分步查询:是指将问题拆解成多个步骤,每个步骤都会根据前一个步骤的回答再做应答。

Evaluation step: 评估提供客观的度量,衡量对查询响应的准确性、忠实度和速度。

那么,LlamaIndex 到底是如何实现 RAG 应用的?业务架构如何设计?关键问题如何处理?今天中午直播告诉你,直播精彩看点:

1、LlamaIndex 开发框架深度剖析

2、基于 LlamaIndex 构建企业级应用案例实战

3、LlamaIndex 和 LangChain 联合构建企业级 Agent 案例实战

请同学点击下方按钮预约直播,咱们今天中午11:30直播见!

2

新年领取《AI 大模型技术知识图谱

我们梳理了下 AI 大模型的知识图谱,包括12项核心技能:大模型内核架构、大模型开发 API、开发框架、向量数据库、AI 编程、AI Agent、缓存、算力、RAG、大模型微调、大模型预训练、LLMOps 等。

75ff797b6a2d2dd4ea8a9c07f8bfec8b.png

为了帮助同学们掌握 AI 大模型开发技能,我们准备了一系列免费直播干货扫码全部领取

dde32f8f1e3202351c9d5c7943c7b19d.png

END

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/938938
推荐阅读
相关标签
  

闽ICP备14008679号