当前位置:   article > 正文

本地如何通过Ollama部署llama3、phi3等本地大模型?_ollama phi3

ollama phi3

一、ollama是什么?

在本地启动并运行大型语言模型。运行Llama 3,Mistral, Gemma, Code Llama和其他模型。自定义并创建您自己的。

优势如下:

  • • 快速下载+容器自动运行大模型,现在下载,马上上手。

  • • 本地利用 cpu 运行大模型,本地安全可靠。

  • • ollama 命令,管理大模型相对方便,也可以多个大模型中切换。

  • • 终端直接开始聊天。

  • • 社区提供了支持 web api 方式访问 WebUI。

官方网站: Ollama

github :https://github.com/ollama/ollama

二、准备和安装工作

设备需求和辅助软件:

  • • Ollama自带docker ,为了方便部署软件。

  • • 良好的网络环境,大模型还是要先下载下来的。

  • • 配置要求:一般来说参数越大,需要配置越好。

  • • 存储空间:确保硬盘空间充足,并且学会设置环境变量来调整保存model的地址,别再下载到C盘了!

model地址和环境变量设置

win10 设置系统环境变量:OLLAMA_MODELS,值设置本地路径,找个盘空间大点的

下载ollama

官方网站: Ollama

进入 ollama 下载页面,选择自己的系统版本的下载并安装即可。

检验是否安装成功

打开cmd命令窗口,输入ollama

Microsoft Windows [版本 10.0.19045.4291]  
(c) Microsoft Corporation。保留所有权利。  
  
C:\Users\hcq>ollama  
Usage:  
  ollama [flags]  
  ollama [command]  
  
Available Commands:  
  serve       Start ollama  
  create      Create a model from a Modelfile  
  show        Show information for a model  
  run         Run a model  
  pull        Pull a model from a registry  
  push        Push a model to a registry  
  list        List models  
  cp          Copy a model  
  rm          Remove a model  
  help        Help about any command  
  
Flags:  
  -h, --help      help for ollama  
  -v, --version   Show version information  
  
Use "ollama [command] --help" for more information about a command.  
  
C:\Users\hcq>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27

三、ollama 模型库

详见library (https://ollama.com),用于搜索已收录的模型库。以下是一些流行的模型:

模型参数尺寸执行下载
Llama3 8B8B4.7GBollama run llama3:8b
Llama3 70B70B40GBollama run llama3:70b
Mistral7B26GBollama run mistral
Code Llama 7b7B3.8GBollama run codellama:7b
Code Llama 13b13B7.4GBollama run codellama:13b
Code Llama 34b34B19GBollama run codellama:34b
Code Llama 70b70B39GBollama run codellama:70b
Gemma2B1.7GBollama run gemma:2b
Gemma7B5GBollama run gemma:7b

Llama 3的亮点和特性如下:

基于超过15T token训练,大小相当于Llama 2数据集的7倍还多;训练效率比Llama 2高3倍;支持8K长文本,改进的tokenizer具有128K token的词汇量,可实现更好的性能;在大量重要基准测试中均具有最先进性能;增强推理和代码能力;安全性有重大突破,带有Llama Guard 2、Code Shield 和 CyberSec Eval 2的新版信任和安全工具,还能比Llama 2有更好“错误拒绝表现”。

四、下载运行模型

ollama run llama3:8b
  • 1

直接在终端中对话:用 llama3 模型写一个 python函数 或者 回答你的一些知识类问题

根据实际测试,llama3 70B在windows10环境下,基本占用32GB内存,llama3 8B基本占用16GB内存。

建议至少不低于48GB或64GB内存,否则没有足够内存支持运行其他程序。

第三方API调用

API调用默认端口 11434

本地地址参考:127.0.0.1:11434

五、通过seo-tool工具调用

seo-tool工具已集成ollama接口,只要在调用前本地启动模型即可,而且通过seo-tool可以根据标题或关键词批量生成文章,如果本地跑llama3费劲,可以调用 ollama run qwen 来运行阿里的通译千问大模型,生成内容质量还可以而且速度也很快,(题外:生成的文章如果收录不是很好,最好不要用markdown格式和html格式,直接用文本格式)

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/903903
推荐阅读
相关标签