当前位置:   article > 正文

10分钟私有化部署一个大语言模型:用最强开源大语言模型LLama3+AnythingLLM,打造一个知识库_llama3零成本构建私有ai知识库

llama3零成本构建私有ai知识库

     前言

    4月18日,Meta终于正式发布全新一代开源模型Llama3,为训练这个模型,投入了49152块H100的GPU,经大咖们评测,这是比肩GPT4的开源大型,下图是多个场景的测试对比。

688340ac63234acb89cbfcd82dee0e5b.png

       出于个人兴趣和好奇,我也花了点时间进行了私有化的部署,并基于AnythingLLM打造了一个知识库,现分享一下部署的过程,希望越来越多的人投入到大模型的应用开发中,一起交流打造良好的生态。

     先展示成果

      我上传了这篇文章《中国信通院余晓晖:推动算力基础设施高质量发展》到大模型知识库中,文章有一段内容如下:

3d69d57c1b8c426c945ba1853aaf5c1d.png

      对大模型提问,如下结果,还是令人很满意的:

      5af7fab5e82443b5bf542b47cceab0ef.png

      知识库整体架构

       使用Ollama部署Llama3,由于Llama3自身对中文支持不好,所以此次部署的是王慎执博士对llama3微调之后的8B版本,大模型采用8位量化,向量数据库用的是LanceDB。知识库整体架构及访问流程如下:

66111cea9c2246a796ef859d5a3a6c11.png

部署

基于以上架构,需要部署的组件时Ollama,Llama3,AnythingLLM,LanceDB(AnythingLLM自带,不需要单独部署)

部署Ollama及Llama3

在linux服务器中执行命令,在线下载并安装Ollama和Llama3

  1. #安装ollama
  2. curl -fsSL https://ollama.com/install.sh | sh
  3. #下载llama3
  4. ollama run wangshenzhi/llama3-8b-chinese-chat-ollama-q8

修改ollama配置

vim /etc/systemd/system/ollama.service

6f67b90b2f4242a5b61655b978ed2838.png

  1. #重启ollama
  2. systemctl restart ollama
  3. systemctl daemon-reload
  4. #将ollama访问端口加到防火墙
  5. firewall-cmd --zone=public --add-port=11434/tcp --permanent
  6. #重启防火墙
  7. firewall-cmd --reload

部署AnythingLLM

以下是下载的网站,根据系统的不同,下载对应的版本安装即可

Download AnythingLLM for DesktopDownload the ultimate "all in one" chatbot that allows you to use any LLM, embedder, and vector database all in a single application that runs on your desktop. 100% privately.https://useanything.com/download

配置AnythingLLM

打开AnythingLLM,页面如下:

ecfb69eb6f7f4120aeddb923351e116c.png

选择Ollama,输入Ollama的服务器地址,选择已经部署好的大模型,一直点右边的箭头到最后完成即可。

c2b908e9ae634dd096dd8721c16c9114.png

点击小扳手进入设置界面

8e04d37ea86641ebb7b897a0690e4bf5.png

查看大模型的参数配置,输入大模型的本地访问地址

5f670a0d04034512b4ebfc51c6352d5d.png

配置Embedding模型的参数,这里也配置大模型的地址

a1c5bd28d841444ca39baf678c6c387b.png

调整Chunk大小,可以根据回答的结果准确性微调

1da39d27f9134fc99708c2c16f4709a7.png

配置向量数据库

0b5fd24fc28e44418e2085c44d9f4619.png

workspace配置

配置对话模式为Query,仅从知识库中获取答案并回答

31677463b0654021977501ba1837f96a.png

进入主界面后,创建一个workspace,点击上传箭头,会弹出一个页面,可以将文件上传到知识库

5970801f0ac84ae9a87cc5bf8b2b802d.png

上次文件之后,选中后,点击Move to Workspace移动到右边的框中

61686d81085b4b3a8efeda29f80a8556.png

执行右下角的Save and Embed,会将文件向量化后存储到向量数据库中9d92f1bc4751459c859ac1a08e7580eb.png

返回页面即可跟大模型对话,获取想要的答案

581b4ae6f63449fc83242a1a07a397c2.png

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/696144
推荐阅读
相关标签
  

闽ICP备14008679号