NCNN量化详解2_ncnn 量化

作者：Cpp五条 | 2024-06-11 13:06:26

踩

ncnn 量化

量化算法介绍的文章的话，下面这篇文章的大佬 @章小龙介绍的比我好多啦。虽然介绍的是NVIDIA TensorRT的算法，但是NCNN是参考其算法做出来的，方法几乎一样

变换公式
正常的量化，FP32 Value 和 INT8 Value之间的关系是这样的：
在这里插入图片描述
NVIDIA表示，Bias是没用的，因此变成了一个线性公式：

取值范围
由于float32的取值范围几乎是

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Cpp五条/article/detail/703317