凡人多烦事01

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

大模型部署手记（1）ChatGLM2+Windows GPU_chatglm2国内镜像下载

作者：凡人多烦事01 | 2024-04-29 12:00:45

赞

踩

chatglm2国内镜像下载

1.简介：

组织机构：智谱/清华

代码仓：https://github.com/THUDM/ChatGLM2-6B

模型：THUDM/chatglm2-6b

下载：https://huggingface.co/THUDM/chatglm2-6b

镜像下载：https://aliendao.cn/models/THUDM/chatglm2-6b

硬件环境：暗影精灵7Plus

Windows版本：Windows 11家庭中文版 Insider Preview 22H2

内存 32G

GPU显卡：Nvidia GTX 3080 Laptop （16G）

torch推荐使用 2.0 及以上的版本，以获得最佳的推理性能 :

nvidia-smi

CUDA是12.2版本。

nvcc -V

nvcc显示CUDA 11.6版本。

查看Nvidia控制面板：

2.代码和模型下载：

下载代码仓：

git clone https://github.com/THUDM/ChatGLM2-6B

浏览器打开 https://huggingface.co/THUDMM/chatglm2-6b/tree/main，选择 Files and versions，将所有文件都下载下来：

或者换这个地址：

https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b&mode=list

或者换这个地址：

https://aliendao.cn/models/THUDM/chatglm2-6b

可以切换到Linux，执行以下命令，从镜像下载模型：

cd /home1/zhanghui/aliendao

python3 model_download.py --mirror --repo_id THUDM/chatglm2-6b

实验表明镜像站下载大的模型文件大概率还是会出现下载卡住的情形。

将下载好的文件移动到 /home1/zhanghui/ChatGLM2-6B/THUDM/chatglm2-6b 目录下（gitattributes文件可以改名为 .gitattributes)

将前面从Linux上下载好的ChatGLM2-6b的模型文件传到 D:\ChatGLM2-6B 目录下：

3.安装依赖

进入Anaconda提示符界面：

conda create -n torch2.0 python=3.8

conda activate torch2.0

d:

cd ChatGLM2-6B

安装pip依赖：

pip install -r requirements.txt

4.部署验证

启动:

python web_demo.py

修改 web_demo.py，将模型路径改为文件路径：

重试：

python web_demo.py

查看 https://betheme.net/qianduan/121637.html

降级一下transformers试试：

pip install transformers==4.26.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

重试：

python web_demo.py

这个torch安装的是一个非GPU的版本啊。

参考：https://pytorch.org/get-started/locally/

安装GPU版本的pytorch:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

重试：

python web_demo.py

错误还是一样的。

换种方法，使用conda方式安装pytorch 2.0.1 for CUDA 11.8版本：

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

安装的是pytorch2.0.1+torchvision 0.15.2

重试：

python web_demo.py

pip install chardet

重试：

python web_demo.py

终于启动起来了。

浏览器打开 http://127.0.0.1:7860

感觉有点奇怪，回答怎么没有呢？

换成streamlit方式启动试试吧：

streamlit run web_demo2.py

根据提示，使用浏览器打开 http://127.0.0.1:8501/

问两个问题吧：

回答的时候，GPU情况如下：

可以接着问：

好了，你知道得太多了。该睡觉了。

（全文完，谢谢阅读）

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/凡人多烦事01/article/detail/507641

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号