当前位置:   article > 正文

本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner

rwkv模型下载
仓库地址:https://github.com/josStorer/RWKV-Runner
预设配置已经开启自定义CUDA算子加速,速度更快,且显存消耗更少。如果你遇到可能的兼容性问题,前往配置页面,关闭使用自定义CUDA算子加速
如果Windows Defender说这是一个病毒,你可以尝试下载v1.3.7_win.zip,然后让其自动更新到最新版,或添加信任
对于不同的任务,调整API参数会获得更好的效果,例如对于翻译任务,你可以尝试设置Temperature为1,Top_P为0.3

功能

  • RWKV模型管理,一键启动
  • 与OpenAI API完全兼容,一切ChatGPT客户端,都是RWKV客户端。启动模型后,打开 http://127.0.0.1:8000/docs 查看详细内容
  • 全自动依赖安装,你只需要一个轻巧的可执行程序
  • 预设了2G至32G显存的配置,几乎在各种电脑上工作良好
  • 自带用户友好的聊天和补全交互页面
  • 易于理解和操作的参数配置
  • 内置模型转换工具
  • 内置下载管理和远程模型检视
  • 内置一键LoRA微调
  • 也可用作 OpenAI ChatGPT 和 GPT Playground 客户端
  • 多语言本地化
  • 主题切换
  • 自动更新

API并发压力测试

 
ab -p body.json -T application/json -c 20 -n 100 -l http://127.0.0.1:8000/chat/completions

body.json:

  1. {
  2. "messages": [
  3. {
  4. "role": "user",
  5. "content": "Hello"
  6. }
  7. ]
  8. }

Embeddings API 示例

如果你在用langchain, 直接使用 OpenAIEmbeddings(openai_api_base="http://127.0.0.1:8000", openai_api_key="sk-")

  1. import numpy as np
  2. import requests
  3. def cosine_similarity(a, b):
  4. return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
  5. values = [
  6. "I am a girl",
  7. "我是个女孩",
  8. "私は女の子です",
  9. "广东人爱吃福建人",
  10. "我是个人类",
  11. "I am a human",
  12. "that dog is so cute",
  13. "私はねこむすめです、にゃん♪",
  14. "宇宙级特大事件!号外号外!"
  15. ]
  16. embeddings = []
  17. for v in values:
  18. r = requests.post("http://127.0.0.1:8000/embeddings", json={"input": v})
  19. embedding = r.json()["data"][0]["embedding"]
  20. embeddings.append(embedding)
  21. compared_embedding = embeddings[0]
  22. embeddings_cos_sim = [cosine_similarity(compared_embedding, e) for e in embeddings]
  23. for i in np.argsort(embeddings_cos_sim)[::-1]:
  24. print(f"{embeddings_cos_sim[i]:.10f} - {values[i]}")

相关仓库:

Preview

主页

image

聊天

image

补全

image

配置

image

模型管理

image

下载管理

image

LoRA微调

image

设置

image

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/643976
推荐阅读
相关标签
  

闽ICP备14008679号