赞
踩
Ollama
Ollama 是一个开源的大型语言模型(LLM)服务工具,它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架,旨在简化在 Docker 容器中部署和管理大型语言模型的过程,使得这一过程变得简单快捷。用户可以通过简单的命令行操作,快速在本地运行如 Llama 3 这样的开源大型语言模型。
应用模型
注意:推荐下载 GGUF文件格式的模型,可以快速简洁的导入 Ollama 中。
0X01 下载模型文件
下载地址:https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit/tree/main。
下载 Llama3-8B-Chinese-Chat-q8_0-v2_1.gguf 模型文件。
添加图片注释,不超过 140 字(可选)
0X02 编写模型文件
Modelfile文件内容如下:
# FROM 指定 GGUF 文件的路径
FROM D:/AI/Download/Llama3-8B-Chinese-Chat-q8_0-v2_1.gguf
0X03 创建 Ollama 模型
使用ollama create命令可以根据Modelfile创建一个新的模型:
ollama create tinywan-Ll
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。