赞
踩
LocalAI 是一个用于本地推理的,与 OpenAI API 规范兼容的 REST API。
它允许您在本地使用消费级硬件运行 LLM(不仅如此),支持与 ggml 格式兼容的多个模型系列。支持CPU硬件/GPU硬件。
视频地址:
【LocalAI】(3):超级简单!在linux上使用一个二进制文件,成功运行embeddings和qwen-1.5大模型,速度特别快,有gitee配置说明
模型启动方法:
https://localai.io/models/
项目地址:
https://gitee.com/fly-llm/localai-run-llm
下载二进制文件:
https://github.com/mudler/LocalAI/releases
curl http://localhost:8080/models/apply -H "Content-Type: application/json" -d '{
"url": "https://gitee.com/fly-llm/localai-run-llm/raw/master/model-gallery/bert-embeddings.yaml",
"name": "text-embedding-ada-002"
}'
测试:
curl -X 'POST' http://0.0.0.0:8080/v1/embeddings \
-H "Content-Type: application/json" \
-d '{
"input": "测试ebmeddings",
"model": "text-embedding-ada-002"
}'
参考地址:
https://github.com/mudler/LocalAI/issues/1110
curl http://localhost:8080/models/apply -H "Content-Type: application/json" -d '{
"url": "https://gitee.com/fly-llm/localai-run-llm/raw/master/model-gallery/qwen1.5-0.5b.yaml",
"name": "qwen1.5-0.5b-chat"
}'
测试接口
curl -X 'POST' 'http://0.0.0.0:8080/v1/chat/completions' \
-H 'Content-Type: application/json' -d '{
"model": "qwen1.5-0.5b-chat",
"messages": [
{
"role": "user",
"content": "北京景点?"
}
],
"max_tokens": 512,
"temperature": 0.7
}'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。