赞
踩
js
复制代码
$conda create -n fastchat python=3.11
系统运行后,选择y安装相关的包依赖。 提示成功创建fastchat环境内后,运行命令,
js
复制代码
$conda activate fastchat
激活虚拟坏境
js
复制代码
pip3 install fschat[model_worker,webui]
js
复制代码
python3 -m fastchat.serve.controller` #启动控制器
重新激活一个fastchat环境,运行命令
js
复制代码
python3 -m fastchat.serve.model_worker --load-8bit --model-name 模型名称--model-path /模型本地位置/ #启动模型服务
(如果显存大,可不用8bit启动,模型推理效果更好) 重新激活一个fastchat环境,运行命令
js
复制代码
python3 -m fastchat.serve.openai_api_server --host 0.0.0.0 --port 8000 #开启对外API服务,端口是8000
注意:以上3个命令要开启3个命令窗口,激活3遍虚拟环境,要保持3个窗口同时运行。
最后可以通过
js
复制代码
curl http://localhost:8000/v1/models
检查API接口是否可用,如有返回值,说明接口可用。
这个项目代码我已经开源到GitHub上了,可以点这个链接,直接下载整个项目代码: github.com/davidhandso…
以上,大模型的本地加载和提供API接口已经完成了,接下来就是embedding 数据库了,请看RAG项目第二集:知识图谱embeddings向量数据库。
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料
包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。