论文标题:Pruning and Quantization for Deep Neural Network Acceleration: A Survey 论文链接:https://arxiv.org/abs/2101.09671 作者单位:北京科技大学, 华夏芯公司 39页综述,共计266篇参考文献!本文提供了两大类模型压缩方向进行全面调研:剪枝和量化。本文盘点并介绍了当前的技术,分析它们的优缺点,旨在为模型压缩提供技术指导!强烈推荐阅读和学习!

深度神经网络已在计算机视觉领域中展现出非凡能力,在许多领域中得到应用。但是,复杂的网络体系结构对有效的实时部署提出了挑战,并需要大量的计算资源和能源成本。这些挑战可以通过诸如网络压缩之类的优化来克服。本文提供了对两种类型的模型压缩的调研:剪枝和量化。我们将比较当前的技术,分析它们的优缺点,为模型压缩提供指导,并讨论可能的未来压缩技术。

内容中包含的图片若涉及版权问题,请及时与我们联系删除