当前位置:   article > 正文

RAG部署 | 使用TensorRT-LLM在Windows上部署检索增强生成聊天机器人RAG_llm rag系统搭建 windows

llm rag系统搭建 windows
  • 项目应用场景
    • 面向 Windows 平台部署 RAG 检索增强生成聊天机器人场景,项目采用 TensorRT-LLM 进行 GPU 加速推理,注意项目需要 RT4090 及以上的英伟达显卡支持。
  • 项目效果

  • 项目细节 ==> 具体参见项目 README.md
    • (1) 下载构建好的 Llama2 TensorRT 模型到指定文件夹,具体见 README
    • (2) 安装依赖
pip install -r requirements.txt
    • (3) 执行程序
python app.py --trt_engine_path <TRT Engine folder> --trt_engine_name <TRT Engine file>.engine --tokenizer_dir_path <tokernizer folder> --data_dir <Data folder>
  • 项目获取
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/1010067
推荐阅读
相关标签
  

闽ICP备14008679号