赞
踩
Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
为什么选择 Xinference?
启动后的画面,
conda create -n xinference python=3.10 -y
conda activate xinference
conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install https://github.com/abetlen/llama-cpp-python/releases/download/v0.2.55/llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl
refer: https://github.com/abetlen/llama-cpp-python
pip install https://github.com/li-plus/chatglm.cpp/releases/download/v0.3.1/chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl
refer: https://github.com/li-plus/chatglm.cpp
pip install "xinference[all]"
refer: https://github.com/xorbitsai/inference
在我的电脑上设置环境变量,路径请根据各自环境修改。
XINFERENCE_HOME=F:\XinferenceCache
xinference-local -H <your_ip>
选择一个 Model 运行,
运行成功后,在 “Running Models” 页面可以查看,
点击 Cluster Information,
完结!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。