悉尼大学 & 伦敦大学联合出品：知识蒸馏最新综述

深度学习通过参数量巨大的模型，近几年中在多个领域取得了较好的效果，但是往往因为模型体积过大（模型的体积指的就是模型的大小，比如 ResNet18 体积为 44.6MB 等）、计算耗时等因素，无法部署在一些资源受限的移动设备或者嵌入式设备中。因此人们提出了多种对模型体积进行压缩，或者加速模型计算的方法。

在这些方法中，知识蒸馏利用一个体积小的模型（在知识蒸馏中称为学生神经网络，Student）从一个体积较大的模型中学习知识（在知识蒸馏中称为教师神经网络, Teacher），进行模型压缩，得到了学术界的关注。

这篇文章从以下几方面提供给读者一个对知识蒸馏清晰的认识：