赞
踩
我刚开始直接pip install auto-gptq,产生了一系列的问题。本地是CUDA11.6,首先的问题是无法量化。
gptq本身是一个github仓库,
https://github.com/PanQiWei/AutoGPTQ
随后集成在了Transformers 库里,介绍如下: