赞
踩
量化感知训练(Quantization Aware Training)是在模型中插入伪量化模块(fake_quant module)模拟量化模型在推理过程中进行的舍入(rounding)和钳位(clamping)操作,从而在训练过程中提高模型对量化效应的适应能力,获得更高的量化模型精度 。
在这个过程中,所有计算(包括模型正反向传播计算和伪量化节点计算)都是以浮点计算实现的,在训练完成后才量化为真正的int8模型。
Pytorch官方从1.3版本开始提供量化感知训练API,只需修改少量代码即可实现量化感知训练。
参考资料:
Pytorch量化感知训练-代码示例
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。