最新开源对话大模型glm-4-9b-chat本地部署使用_glm-4-9b-chat 下载

作者：在线问答5 | 2024-07-07 01:17:57

踩

glm-4-9b-chat 下载

简介

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的模型。

本文以glm-4-9b-chat为例，部署环境如下：

Ubuntu 22.04.4 LTS
显卡 RTX 4090（Nvidia驱动550.78）
内存 32G
1
2
3

部署步骤

1.glm4代码下载

git clone https://github.com/THUDM/GLM-4
1

2.模型文件下载(大约36G)

# 安装git lfs大文件存储插件
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
apt install git-lfs
# 激活插件
git lfs install

# 下载模型文件
git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat.git
1
2
3
4
5
6
7
8

3.修改trans_cli_demo.py指向模型所在路径

vim trans_cli_demo.py

# MODEL_PATH修改为如下，/root/glm-4-9b-chat换成你的模型目录
MODEL_PATH = os.environ.get('MODEL_PATH', '/root/glm-4-9b-chat')
1
2
3
4

4.运行模型

# 安装python虚拟环境
cd /root
apt install python3.10-venv
mkdir -pv .virtualenvs/glm-4-9b-chat
python -m venv .virtualenvs/glm-4-9b-chat
source /root/.virtualenvs/glm-4-9b-chat/bin/activate

# 安装依赖包，依赖包有很多，耐心等待安装完成
cd /root/GLM-4/basic_demo
pip install -r requirements.txt

# 运行模型
python trans_cli_demo.py
1
2
3
4
5
6
7
8
9
10
11
12
13

然后可以像下面这样跟glm-4-9b-chat对话（在4090上模型的回答速度还是很快的）：

在这里插入图片描述
同时，你还可以用nvtop命令看到有一个进程在GPU上运行：

在这里插入图片描述
完！

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/在线问答5/article/detail/794496