赞
踩
LLM之RAG之LlaMAIndex:llama-index(一块轻快构建索引来查询本地文档的数据框架神器)的简介、安装、使用方法之详细攻略
目录
(2)、使用非 OpenAI 的 LLM(例如在 Replicate 上托管的 Llama 2)构建一个简单的向量存储索引
LLM之RAG之LlaMAIndex:基于LLamaIndex框架和ChatGPT接口设计RAG系统来实现构建和查询本地文档索引实战代码之详细攻略
2023年1月29日正式发布,LlamaIndex(GPT Index)是一个用于 LLM 应用的数据框架。使用 LlamaIndex 构建应用通常涉及使用 LlamaIndex 核心和一组选择的集成(或插件)。LLMs 是一种生成知识和推理的非凡技术。它们在大量公开可用数据上进行预训练。
LlamaIndex是一个数据框架,用于基于LLM的应用程序摄取、构建和访问私有或特定领域的数据。它可以在Python(这些文档)和Typescript中使用。LLM提供了人与数据之间的自然语言接口。广泛可用的模型已经在大量公开可用的数据上进行了预训练,如维基百科、邮件列表、教科书、源代码等。然而,尽管LLM经过大量数据的训练,但它们并没有经过你自己数据的训练,而您的数据可能是私有的或特定于您尝试解决的问题。它可能位于API后面,存储在SQL数据库中,或者被封存在PDF和幻灯片中。
LlamaIndex通过连接到这些数据源,并将数据添加到LLM已经拥有的数据中来解决这个问题。这通常被称为检索增强生成(RAG)。RAG使您能够使用LLM来查询数据、转换数据并生成新的见解。你可以询问有关数据的问题,创建聊天机器人,构建半自主代理等等。要了解更多信息,请查看左侧的用例。
LlamaIndex为初学者、高级用户以及介于两者之间的所有人提供了工具。我们的高级API允许初学者使用LlamaIndex在5行代码中摄取和查询他们的数据。对于更复杂的应用程序,我们的低级api允许高级用户定制和扩展任何模块——数据连接器、索引、检索器、查询引擎、重新排序模块——以满足他们的需求。对比LangChain(重点是Agent 和 Chain 上),LlamaIndex的一个很大的优势,通过各种方式为文本建立索引,能够创建层次化的索引,这在语料库增长到一定大小时非常有帮助。
llama-index库目前在持续迭代。早期版本,对于中文支持存在一些小缺陷。它提供了许多DataConnector选项,包括PDF、ePub等电子书格式以及YouTube、Notion、MongoDB等外部数据源和API接入数据甚至本地数据库的数据。你可以在 llamahub.ai 上查看社区开发的各种不同数据源格式的DataConnector。
我们如何最好地用自己的私有数据增强 LLMs?我们需要一个综合工具包来帮助为 LLMs 执行这种数据增强。这就是 LlamaIndex 的作用所在。LlamaIndex 是一个“数据框架”,帮助你构建 LLM 应用。它提供以下工具:
>> 提供数据连接器以摄取你现有的数据源和数据格式(API、PDF、文档、SQL 等)。
>> 提供结构化数据的方法(索引、图表),以便这些数据可以轻松与 LLMs 一起使用。
>> 提供一个高级检索/查询接口:输入任何 LLM 提示,获取检索到的上下文和知识增强的输出。
>> 允许与外部应用框架轻松集成(例如,与 LangChain、Flask、Docker、ChatGPT 等)。
LlamaIndex 为初学者和高级用户提供工具。我们的高级 API 允许初学者在 5 行代码中使用 LlamaIndex 来摄取和查询数据。我们的低级 API 允许高级用户定制和扩展任何模块(数据连接器、索引、检索器、查询引擎、重新排序模块),以满足他们的需求。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。