多大分辨率图像做分类更适合？浙大&华为&国科大等提出Dynamic Resolution Network，降低计算量还提性能！

为了获得更高的精度，深卷积神经网络（CNN）通常具有复杂的设计，具有许多卷积层和可学习的参数。为了减轻在移动设备上部署网络的成本，最近的工作开始研究在预定义的结构中挖掘冗余的模块和参数。然而，目前CNN的输入分辨率冗余尚未得到充分研究。

在本文中，作者观察到，使用相同的神经网络，精确预测不同图像的最小分辨率是不同的。为此，作者提出了一种新的动态分辨率网络（DRNet），其中分辨率是根据每个输入样本动态确定的。

基于此，作者提出了一个具有可忽略计算成本的分辨率预测器，并与分类网络一起进行了优化。在实现上，预测器学习的最小分辨率可以保持甚至超过每个图像原始识别精度。在推断过程中，每个输入图像将调整到其预测的分辨率，以最小化总体计算负担。然后，作者在几个基准网络和数据集上进行了广泛的实验。

结果表明，本文的DRNet可以嵌入任何现成的网络结构中，从而大大降低计算复杂度。例如，与ImageNet上的原始ResNet-50相比，DRNet在计算量减少约34%的情况下实现了类似的性能，而在计算量减少10%的情况下，DRNet的精度提高了1.4%。

论文链接：

为了能够在不同的样本在训练和测试过程中有不同的分辨率，作者提出了一种实例感知分辨率的选择方法。如上图所示，本文的模型主要由两部分组成：用于分类的基础网络，如ResNet和EfﬁcientNet，以及分辨率预测器，该预测器输出的分辨率在性能和计算上都是高效的。

将一个样本送入改pipeline时，分辨率预测器首先对其进行预处理，并为输入图像输出合适的分辨率r。有了这个合适的分辨率，图像会相应地调整大小，然后被送入基本网络以继续分类。这种方式可以节省大量冗余计算，并保持高性能。分辨率预测器和基础网络在训练过程中进行端到端优化。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

​多大分辨率图像做分类更适合？浙大&华为&国科大等提出Dynamic Resolution Network，降低计算量还提性能！