当前位置:   article > 正文

开源模型应用落地-模型量化-AWQ vs GPTQ(三)_aqw gptq性能比较

aqw gptq性能比较

一、前言

    在开源模型百花齐放的时代,每个人都想动手尝试,但是由于模型规模的较大和设备资源的不足,很多人只能望而却步。不过,通过模型量化技术,我们可以大大降低模型的存储需求和计算复杂度,从而提高在这些设备上的效率和性能。这样一来,就能够以较低的成本体验大语言模型的魅力了。

    开源模型应用落地-模型量化-Qwen1.5-7B-Chat-GPTQ-Int8(一)-CSDN博客文章浏览阅读64次,点赞10次,收藏9次。理解GPTQ模型量化技术,以低成本体验大语言模型的魅力https://charles.blog.csdn.net/article/details/139001380

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/1014489
推荐阅读
相关标签
  

闽ICP备14008679号