当前位置:   article > 正文

Post-training量化策略——without training or re-training

post-training

基于Pre-trained模型,采用Post-training量化策略,能够在一定程度上弥补量化精度损失,并且避免了相对耗时的quantization-ware training或re-training过程。

  • WA与BC

"Data-Free Quantization through Weight Equalization and Bias Correction" 这篇文章提出了两种post-training策略,包括Weight Adjustment (WA)与Bias Correction (BC)。

Paper地址:

1. Weight Adjustment

在执行Per-tensor量化时,由于Weights或Activation的数值分布存在奇异性,例如存在个别数值较大的outliers,导致宽泛的分布区间对量化(如MAX方法)不友好,产生较大的量化精度损失。Weight Adjustment通过在相邻的[Weight-tensor, Weight-tensor]或[Activation-tensor, Weight-tensor]之间,执行均衡调整、等价变换(确保变换后推理精度不变),使得调整之后的数值分布对量化更为友好。

具体的WA策略如下所示,均衡调整通常在W1的output channel与W2的input channel之间进行:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/366045
推荐阅读
相关标签
  

闽ICP备14008679号