Post-training量化策略——without training or re-training

作者：很楠不爱3 | 2024-04-05 14:00:38

踩

post-training

基于Pre-trained模型，采用Post-training量化策略，能够在一定程度上弥补量化精度损失，并且避免了相对耗时的quantization-ware training或re-training过程。

WA与BC

"Data-Free Quantization through Weight Equalization and Bias Correction" 这篇文章提出了两种post-training策略，包括Weight Adjustment (WA)与Bias Correction (BC)。

Paper地址：

1. Weight Adjustment

在执行Per-tensor量化时，由于Weights或Activation的数值分布存在奇异性，例如存在个别数值较大的outliers，导致宽泛的分布区间对量化（如MAX方法）不友好，产生较大的量化精度损失。Weight Adjustment通过在相邻的[Weight-tensor, Weight-tensor]或[Activation-tensor, Weight-tensor]之间，执行均衡调整、等价变换（确保变换后推理精度不变），使得调整之后的数值分布对量化更为友好。

具体的WA策略如下所示，均衡调整通常在W1的output channel与W2的input channel之间进行：

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/366045