当前位置:   article > 正文

NCNN量化详解2_ncnn 量化

ncnn 量化

1 NCNN量化算法简介

量化算法介绍的文章的话,下面这篇文章的大佬 @章小龙 介绍的比我好多啦。虽然介绍的是NVIDIA TensorRT的算法,但是NCNN是参考其算法做出来的,方法几乎一样

首先NVIDIA有一个PPT,很好的阐述了他们的方案,推荐大家也去看一下:
https://link.zhihu.com/?target=http%3A//on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf

变换公式
正常的量化,FP32 Value 和 INT8 Value之间的关系是这样的:
在这里插入图片描述
NVIDIA表示,Bias是没用的,因此变成了一个线性公式:
在这里插入图片描述
取值范围
由于float32的取值范围几乎是

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/703317
推荐阅读
相关标签
  

闽ICP备14008679号