很楠不爱3

这个屌丝很懒，什么也没留下！

热门标签

GpuMall智算云教程：ChatGLM3-6B 对话预训练模型_chatglm3—6b怎么训练

作者：很楠不爱3 | 2024-05-23 17:37:15

踩

chatglm3—6b怎么训练

#大模型##GpuMall智算云#

#算力##租赁#

1. 选择 ChatGLM3-6B 镜像创建实例

提示

训练 ChatGLM3-6B 模型，显卡显存建议选择等于大于 16GB 以上的显卡，因为 ChatGLM3-6B 模型载入后会占用大约 13GB 左右显卡显存。

chatglm3_001_image

选择完成后创建实例，然后点击 JupyterLab，进入终端。

chatglm3_002_image

2. 通过内网拉取 ChatGLM3-6B 模型

执行如下命令拉取 ChatGLM3-6B 模型


curl -fSLO https://gpumall-static-data-public-prod.oss-cn-shanghai.aliyuncs.com/platform/instance/downmodel
chmod +x downmodel
./downmodel chatglm3-6b-model

通过上述操作拉取的模型会存储在 /gm-data/chatglm3-6b 目录下，不建议移动，ChatGLM3-6B 代码中已指定模型路径为 /gm-data/chatglm3-6b。

chatglm3_003_image

然后等待模型全部下载完成

3. 启动 ChatLM3-6B

ChatGLM3-6B 支持如下几种启动方式：


#查看虚拟环境
conda info -e 
# conda environments:
#
base                     /usr/local/miniconda3
ChatGLM3                 /usr/local/miniconda3/envs/ChatGLM3
 
#切换到 ChatGLM3虚拟环境
conda activate ChatGLM3
 
#执行启动脚本会打印支持的几种启动方式
/root/ChatGLM3/start.sh 
 
          支持如下几种启动方式，根据您需要选择一种启动方式即可:
                方式一): Web 网页版对话，通过 Gradio 所生成的地址进行公网访问(国内网络访问可能稍慢),监听8501端口
                /root/ChatGLM3/start.sh web_gradio
 
                方式二): Web 网页版对话，通过 GpuMall 平台自定义服务方式进行公网访问,监听8501端口
                /root/ChatGLM3/start.sh web_streamlit
 
                方式三): 命令行对话，该选项可在命令行与 ChatGLM3-6B 进行交互对话
                /root/ChatGLM3/start.sh terminal
 
                方式四): API 接口方式启动，对该接口进行调用，调用地址通过 GpuMall 平台自定义服务方式所提供的公网地址进行调用
                /root/ChatGLM3/start.sh openapi

chatglm3_004_image

下面会依此演示以上四种启动和通过外网访问方式，根据自己需求选择任意一种即可（通过 API 调用访问方式用的较多）。

3.1 通过Gradio启动

通过 Gradio 方式启动，Gradio 会自动创建一个公网访问链接。


/root/ChatGLM3/start.sh web_gradio
Loading checkpoint shards: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:04<00:00,  1.66it/s]
Running on local URL:  http://127.0.0.1:8501
Running on public URL: https://21e9e47a93316d5515.gradio.live       #复制该链接，该链接为Gradio自动生成的公网访问地址，有效期是72个小时
 
This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)

复制上述链接到浏览器进行访问使用

chatglm3_005_image

3.2 网页版启动

启动网页版，然后通过 GpuMall 平台的自定义服务进行访问


/root/ChatGLM3/start.sh web_streamlit
 
Collecting usage statistics. To deactivate, set browser.gatherUsageStats to False.
 
 
  You can now view your Streamlit app in your browser.
 
  Network URL: http://172.17.0.2:8501
  External URL: http://61.243.114.254:8501

启动后到 GpuMall 实例管理控制台，点击更多——》创建自定义端口。

chatglm3_006_image

输入 8501，因为实例中的 ChatGLM3-6B 项目监听 8501 端口，然后点击确定。

chatglm3_007_image

然后点击自定义服务跳转到公网访问网页页面地址。

chatglm3_008_image

跳转后开始使用

chatglm3_009_image

3.3 命令行对话


root@502430219444229:~# /root/ChatGLM3/start.sh terminal
Loading checkpoint shards: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 7/7 [00:04<00:00,  1.65it/s]
欢迎使用 ChatGLM3-6B 模型，输入内容即可进行对话，clear 清空对话历史，stop 终止程序
 
用户：你好  #输入 文本内容
 
ChatGLM：你好声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/613807
推荐阅读
article超短代码实现！！基于langchain+chatglm3+BGE+Faiss创建拥有自己知识库的大语...
众所周知，大语言模型在落地应用时会遇到各种各样的问题。而其中模型的“致幻性”是非常可怕。目前主流之一的玩法就是通过知识库...
                                    赞
踩
articleAI大模型探索之路-应用篇16：GLM大模型-ChatGLM3 API开发实践...
本章节旨在深入探索ChatGLM3所提供的丰富API接口，不仅覆盖GLM特有的代码风格API开发实践，还包括遵循Open...
                                    赞
踩
articlechatglm3 lora微调，训练+预测问题总结...
ValueError: Tokenizer class ChatGLMTokenizer does not exist ...
                                    赞
踩
articleChatGLM3-6B本地部署LORA微调模型合并以及使用_chatglm3 微调模型合并部署...
IndexError: index out of range in self 原因是数据集太少了，增加数据集，或者修改为...
                                    赞
踩
articlechatglm3-6b 微调训练流程和部署经验总结_chatglm3—6b怎么训练...
chatglm3，微调训练与部署，模型合并，数据集验证等_chatglm3—6b怎么训练chatglm3—6b怎么训练 ...
                                    赞
踩
article昇腾glm3大模型lora微调及推理_mindspore chatglm3...
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 Cha...
                                    赞
踩
article【ChatGLM3-6B】本地大模型使用方法详细教程！！！内含详细的代码解析！！_chatglm3-...
详细介绍ChatGLM3大模型本地部署的方式及使用方法！！！_chatglm3-6b int4版本和 fp16的区别ch...
                                    赞
踩
article开源模型应用落地-chatglm3-6b模型小试-入门篇（二）_chatglm3 qwen1.5...
在windows环境下，使用transformer设置模型参数/System Prompt/历史对话_chatglm3 ...
                                    赞
踩
articleChatGLM3-6B大模型部署、微调【0到1小白教程】_chatglm3 6b最低部署要求...
小白教程，快速部署ChatGlm3大模型、快速使用loar微调大模型！_chatglm3 6b最低部署要求chatglm...
                                    赞
踩
相关标签
langchain
faiss
语言模型
机器学习
自然语言处理
人工智能
AIGC
AI编程
python
chatglm3
lora微调
chatgpt
深度学习
ai
大模型
openai

GpuMall智算云教程：ChatGLM3-6B 对话预训练模型_chatglm3—6b怎么训练

#大模型##GpuMall智算云#

1. 选择 ChatGLM3-6B 镜像创建实例​

2. 通过内网拉取 ChatGLM3-6B 模型​

3. 启动 ChatLM3-6B​

3.1 通过Gradio启动​