llama2使用gptq量化踩坑记录_未安装exllamav2内核

作者：weixin_40725706 | 2024-05-18 22:50:53

踩

未安装exllamav2内核

gptq

我刚开始直接pip install auto-gptq，产生了一系列的问题。本地是CUDA11.6，首先的问题是无法量化。

gptq本身是一个github仓库，

https://github.com/PanQiWei/AutoGPTQ

随后集成在了Transformers 库里，介绍如下：

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/590251

推荐阅读

article 用通俗易懂的方式讲解大模型：Llama2 部署讲解及试用方式...
Llama2 的发布是一个里程碑式的事件，它是一个免费可商用的大型预训练语言模型，可以接收任何形式的自然语言文本输入，并...
赞
踩
article LLaMa2 Chat gpt 大模型本地部署初体验_大模型本地化部署...
一直想在自己电脑或者测试环境随便找台服务器尝试部署一下“大模型”，但“大模型”对于内存和GPU的要求令人望而却步，层出不...
赞
踩
article LLama2大模型指令微调实操：解锁AI生成文本的新境界_指令微调 llama2...
本文将详细介绍如何通过指令微调LLama2大模型，实现AI生成文本的高度个性化。我们将从模型介绍、微调原理、实操步骤和案...
赞
踩
article 大模型部署手记（15）LLaMa2+Ubuntu18.04+privateGPT_privategp...
组织机构：Meta（Facebook）模型：llama-2-7b下载：使用download.sh下载或Huggingfa...
赞
踩
article 大模型部署手记（19）Ubuntu+JupyterLab+Nemo+Llama2+llama-ind...
Ubuntu+JupyterLab+Nemo+Llama2+llama-index+语音对话机器人_ubuntu 大模型...
赞
踩
article 快速玩转 Llama2！机器学习 PAI 最佳实践（二）—全参数微调训练_llama2 怎么微调...
本实践将采用阿里云机器学习平台PAI-DSW模块针对 Llama-2-7B-Chat 进行全参数微调。PAI-DSW是交...
赞
踩
article 将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真...
FastGPT（是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 F...
赞
踩
article 700 亿参数 LLaMA2 训练加速 195%，基础大模型最佳实践再升级_llma2...
作为全球规模最大、最活跃的大模型开发工具与社区，Colossal-AI再次迭代，提供开箱即用的 8 到 512 卡 LL...
赞
踩
article Qwen-7B-Chat-lnt4微调报错：Found modules on cpu/disk. U...
需要修改一下模型下的文件：config.json。_对qwen-7b-chat的int4进行微调对qwen-7b-cha...
赞
踩