赞
踩
基于Pre-trained模型,采用Post-training量化策略,能够在一定程度上弥补量化精度损失,并且避免了相对耗时的quantization-ware training或re-training过程。
WA与BC
"Data-Free Quantization through Weight Equalization and Bias Correction" 这篇文章提出了两种post-training策略,包括Weight Adjustment (WA)与Bias Correction (BC)。
Paper地址:
1. Weight Adjustment
在执行Per-tensor量化时,由于Weights或Activation的数值分布存在奇异性,例如存在个别数值较大的outliers,导致宽泛的分布区间对量化(如MAX方法)不友好,产生较大的量化精度损失。Weight Adjustment通过在相邻的[Weight-tensor, Weight-tensor]或[Activation-tensor, Weight-tensor]之间,执行均衡调整、等价变换(确保变换后推理精度不变),使得调整之后的数值分布对量化更为友好。
具体的WA策略如下所示,均衡调整通常在W1的output channel与W2的input channel之间进行:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。