当前位置:   article > 正文

LLM之Ollama:ollama的简介、安装和使用方法、案例应用之详细攻略_ollama中文说明书

ollama中文说明书

LLM之Ollama:ollama的简介、安装和使用方法、案例应用之详细攻略

目录

ollama的简介

1、模型库

ollama的安装和使用方法

1、下载

macOS、Windows、Linux

Docker

相关库

2、快速入门

3、自定义模型

从 GGUF 导入

从 PyTorch 或 Safetensors 导入

自定义提示

可以使用提示来定制 Ollama 库中的模型。例如,要定制 llama2 模型:

创建一个 Modelfile:

接下来,创建并运行模型:

4、CLI 参考

5、构建

安装 cmake 和 go

运行本地构建

6、REST API

生成响应

与模型聊天

ollama的案例应用—Ollama的两种实现模式:聊天模式、服务器模式

T1、在Dos内直接实现Ollama的CLI聊天模式

T2、基于Ollama后端框架结合WebUI界面+采用Docker部署服务实现Ollama的GUI聊天模式

LLMs之Llama3:手把手教你(只需四步)基于ollama框架(安装并配置)及其WebUI界面对LLaMA-3-8B模型进行Docker部署(打包依赖项+简化部署过程+提高可移植性)并测试对话和图像生成功能

T3、基于Ollama后端框架并开启服务器模式+并结合AnythingLLM实现本地知识库问答

LLMs之RAG:基于Ollama框架(开启服务器模式+加载LLMs)部署LLaMA3/Phi-3等大语言模型、并结合AnythingLLM框架(配置参数LLM Preference【LLM Provider-Chat Model】 /Embedding Preference/Vector Database)实现RAG功能(包括本地文档和抓取网页)实现Chat聊天以及本地知识库问答实战

T4、基于Ollama后端框架结合Dify前端框架实现RAG

LLMs之RAG:基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用


ollama的简介

ollama是一款可以开始使用本地的大型语言模型。启动并运行大型语言模型。运行Llama 2、Code Llama和其他模型。自定义并创建您自己的模型。

官网:Ollama

GitHub地址:GitHub - ollama/ollama: Get up and running with Llama 2, Mistral, Gemma, and other large language models.

1、模型库

Ollama 支持 ollama.com/library 上可用的一系列模型。

注意:运行 7B 模型时,您应至少有 8GB 的可用 RAM,运行 13B 模型时需要 16GB,运行 33B 模型时需要 32GB。

以下是一些可下载的示例模型:

ModelParametersSizeDownload
Llama 27B3.8GBollama run llama2
Mistral7B4.1GBollama run mistral
Dolphin Phi2.7B1.6GBollama run dolphin-phi
Phi-22.7B1.7GBollama run phi
Neural Chat7B4.1GBollama run neural-chat
Starling7B4.1GBollama run starling-lm
Code Llama7B3.8GBollama run codellama
Llama 2 Uncensored7B3.8GBollama run llama2-uncensored
Llama 2 13B13B7.3GBollama run llama2:13b
Llama 2 70B70B39GBollama run llama2:70b
Orca Mini3B1.9GBollama run orca-mini
Vicuna7B3.8GBollama run vicuna
LLaVA7B4.5GBollama run llava
Gemma2B1.4GBollama run gemma:2b
Gemma7B4.8GBollama run gemma:7b

ollama的安装和使用方法

实战安装案例https://yunyaniu.blog.csdn.net/article/details/138235781

1、下载

macOS、Windows、Linux

macOS:https://ollama.com/download/Ollama-darwin.zip

Windows:https://ollama.com/download/OllamaSetup.exe

Linux:

curl -fsSL https://ollama.com/install.sh | sh

手动安装说明:ollama/docs/linux.md at main · ollama/ollama · GitHub

Docker

Ollama 官方 Docker 镜像 ollama/ollama 已在 Docker Hub 上可用。

https://hub.docker.com/r/ollama/ollama

相关库

  1. ollama-python
  2. ollama-js

2、快速入门

要运行并与 Llama 2 聊天:

ollama run llama2

3、自定义模型

​​​​​​​从 GGUF 导入

  1. # 从 GGUF 导入:Ollama 支持在 Modelfile 中导入 GGUF 模型:
  2. 创建一个名为 Modelfile 的文件,其中包含一个 FROM 指令,指向要导入的模型的本地文件路径。FROM ./vicuna-33b.Q4_0.gguf
  3. # 在 Ollama 中创建模型
  4. ollama create example -f Modelfile
  5. # 运行模型
  6. ollama run example

从 PyTorch 或 Safetensors 导入

有关导入模型的指南,请参阅指南。

ollama/docs/import.md at main · ollama/ollama · GitHub

自定义提示

可以使用提示来定制 Ollama 库中的模型。例如,要定制 llama2 模型:
ollama pull llama2

创建一个 Modelfile:
  1. FROM llama2
  2. PARAMETER temperature 1  将温度设置为 1 [较高为更具创造性,较低为更连贯]
  3. # set the system message设置系统消息
  4. SYSTEM """
  5. You are Mario from Super Mario Bros. Answer as Mario, the assistant, only.
  6. ""
  7. FROM llama2

接下来,创建并运行模型:
  1. ollama create mario -f ./Modelfile
  2. ​​​​​​​ollama run mario
  3. >>> hi
  4. Hello! It's your friend Mario.

有关更多示例,请参阅示例目录。有关使用 Modelfile 的更多信息,请参阅 Modelfile 文档。

4、CLI 参考

  1. # 创建模型:使用 Modelfile 创建模型的命令是 ollama create。
  2. ollama create mymodel -f ./Modelfile
  3. # 拉取模型:此命令还可用于更新本地模型。只会拉取差异。
  4. ollama pull llama2
  5. # 删除模型
  6. ollama rm llama2
  7. # 复制模型
  8. ollama cp llama2 my-llama2
  9. 多行输入:对于多行输入,可以使用"""
  10. >>> """Hello,
  11. ... world!
  12. ... """
  13. I'm a basic program that prints the famous "Hello, world!" message to the console.
  14. # 多模态模型
  15. >>> What's in this image? /Users/jmorgan/Desktop/smile.png
  16. The image features a yellow smiley face, which is likely the central focus of the picture.
  17. # 将prompt作为参数传递
  18. $ ollama run llama2 "Summarize this file: $(cat README.md)"
  19. Ollama is a lightweight, extensible framework for building and running language models on the local machine. It provides a simple API for creating, running, and managing models, as well as a library of pre-built models that can be easily used in a variety of applications.
  20. # 列出计算机上的型号
  21. ollama list
  22. # 开始Ollama:在不运行桌面应用程序的情况下启动Ollama时使用Ollama服务。
  23. ollama serve

5、构建

安装 cmake 和 go

  1. # 安装 cmake 和 go
  2. brew install cmake go
  3. # 然后生成依赖项:
  4. go generate ./...
  5. # 然后构建二进制文件:
  6. go build .
  7. 有关更详细的说明,请参阅开发人员指南

运行本地构建

  1. # 接下来,启动服务器:
  2. ./ollama serve
  3. # 最后,在另一个 shell 中,运行一个模型:
  4. ./ollama run llama2

6、REST API

Ollama 具有用于运行和管理模型的 REST API。

生成响应

  1. curl http://localhost:11434/api/generate -d '{
  2. "model": "llama2",
  3. "prompt":"天空为什么是蓝色?"
  4. }'

与模型聊天

  1. curl http://localhost:11434/api/chat -d '{
  2. "model": "mistral",
  3. "messages": [
  4. { "role": "user", "content": "天空为什么是蓝色?" }
  5. ]
  6. }'

有关所有端点的 API 文档,请参阅 API 文档。

ollama的案例应用—Ollama的两种实现模式:聊天模式、服务器模式

持续更新中……​​​​​​​

T1、在Dos内直接实现Ollama的CLI聊天模式

官网查找下载模型的命令→Dos内执行下载→执行对话聊天

模型地址library

  1. ollama run llama3:8b
  2. ollama run llama3:70b
  3. ollama run phi3
  4. ollama run phi3:3.8b-mini-instruct-4k-fp16

​​​​​​​

T2、基于Ollama后端框架结合WebUI界面+采用Docker部署服务实现Ollama的GUI聊天模式

LLMs之Llama3:手把手教你(只需四步)基于ollama框架(安装并配置)及其WebUI界面对LLaMA-3-8B模型进行Docker部署(打包依赖项+简化部署过程+提高可移植性)并测试对话和图像生成功能

https://yunyaniu.blog.csdn.net/article/details/138235781

T3、基于Ollama后端框架并开启服务器模式+并结合AnythingLLM实现本地知识库问答

LLMs之RAG:基于Ollama框架(开启服务器模式+加载LLMs)部署LLaMA3/Phi-3等大语言模型、并结合AnythingLLM框架(配置参数LLM Preference【LLM Provider-Chat Model】 /Embedding Preference/Vector Database)实现RAG功能(包括本地文档和抓取网页)实现Chat聊天以及本地知识库问答实战

https://yunyaniu.blog.csdn.net/article/details/138514062

T4、基于Ollama后端框架结合Dify前端框架实现RAG

LLMs之RAG:基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用

https://yunyaniu.blog.csdn.net/article/details/138514081

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/565941
推荐阅读
相关标签
  

闽ICP备14008679号