深度神经网络加速的剪枝和量化：全面调研

论文标题：Pruning and Quantization for Deep Neural Network Acceleration: A Survey 论文链接：https://arxiv.org/abs/2101.09671 作者单位：北京科技大学, 华夏芯公司 39页综述，共计266篇参考文献！本文提供了两大类模型压缩方向进行全面调研：剪枝和量化。本文盘点并介绍了当前的技术，分析它们的优缺点，旨在为模型压缩提供技术指导！强烈推荐阅读和学习！

深度神经网络已在计算机视觉领域中展现出非凡能力，在许多领域中得到应用。但是，复杂的网络体系结构对有效的实时部署提出了挑战，并需要大量的计算资源和能源成本。这些挑战可以通过诸如网络压缩之类的优化来克服。本文提供了对两种类型的模型压缩的调研：剪枝和量化。我们将比较当前的技术，分析它们的优缺点，为模型压缩提供指导，并讨论可能的未来压缩技术。