赞
踩
Llama2-Chinese工程文件地址
git clone https://github.com/FlagAlpha/Llama2-Chinese
llama2-chinese-7b 中文模型
git clone https://huggingface.co/FlagAlpha/Llama2-Chinese-7b-Chat/tree/main
修改完成后保存,指定0号T4卡后台运行模型
CUDA_VISIBLE_DEVICES=0 python chat_gradio.py &
此处如果不指定T4卡,默认会使用所有的T4调用这个模型
以上,模型成功运行,进入地址 服务器IP:7860,可以进行中文页面对话,如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。