在深度学习中,量化指的是使用更少的bit来存储原本以浮点数存储的tensor,以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点:
1)更少的模型体积,接近4倍的减少; 2)可以更快的计算,由于更少的内存访问和更快的int8计算,可以快2~4倍。
PyTorch对量化的支持目前有如下三种方式:
1)Post Training Dynamic Quantization,模型训练完毕后的动态量化; 2)Post Training Static Quantization,模型训练完毕后的静态量化; 3)QAT(Quantization Aware Training),模型训练中开启量化。
项目链接:https://github.com/DeepVAC/deepvac
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢