PyTorch的量化

在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：

1）更少的模型体积，接近4倍的减少； 2）可以更快的计算，由于更少的内存访问和更快的int8计算，可以快2~4倍。

PyTorch对量化的支持目前有如下三种方式：

1）Post Training Dynamic Quantization，模型训练完毕后的动态量化； 2）Post Training Static Quantization，模型训练完毕后的静态量化； 3）QAT（Quantization Aware Training），模型训练中开启量化。

内容中包含的图片若涉及版权问题，请及时与我们联系删除