大模型【Qwen2-7B本地部署（WEB版）】（windows）_qwen2下载

作者：你好赵伟 | 2024-07-31 06:22:53

踩

qwen2下载

大模型系列文章目录

大模型是截止2024年上半年最强的AI，Qwen2是刚出来的号称国内最强开源大模型。这是大模型系列的第一篇文章，旨在快速部署看看最近出来的大模型效果怎么样，效果ok的话就微调自己的GPTs了。

进入官方教程：https://qwen.readthedocs.io/zh-cn/latest/getting_started/installation.html
先在最下面点击效率评估，看下各个模型占的显存，选择适合自己的，比如我的显卡是4070，有12G显存，我选择的模型就是Qwen2-7B-Instruct GPTQ-Int4
进入下载链接
会看到不同的后缀，q”+ 用于存储权重的位数（精度）+ 特定变体，数字越大性能越强。
数字越大，精度越高，k是在所有的attention和feed_forward张量上将精度提升2位，m是在一半的attention和feed_forward张量上将精度提升2位。
根据自己的需求选择模型，我这里直接选了q8。

FROM ./qwen2-7b-instruct-q8_0.gguf
1

ollama create Qwen2-7B -f ./Modelfile
1

出现success代表创建成功

ollama run Qwen2-7B
1

出现对话框就可以聊天啦
请添加图片描述

如果要看本地有哪些大模型：ollama list
如果要删除这个模型的话：ollama rm xxx
如果要看运行了哪些大模型：ollama ps

但是在dos中聊天总感觉在上世纪的聊天方式一样，所以为了找到GPT的感觉，接下来我们继续在web中实现。

node -v
1

v20以上就没问题

npm config set registry http://mirrors.cloud.tencent.com/npm/
1

npm install
1

如果报错说要audit，则依次进行即可：

npm audit
npm audit fix
1
2

npm run dev
1

打开Web页面，选择你的模型即可开始对话：
请添加图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/907388