为了获得更高的精度,深卷积神经网络(CNN)通常具有复杂的设计,具有许多卷积层和可学习的参数。为了减轻在移动设备上部署网络的成本,最近的工作开始研究在预定义的结构中挖掘冗余的模块和参数。然而,目前CNN的输入分辨率冗余尚未得到充分研究。

在本文中,作者观察到,使用相同的神经网络,精确预测不同图像的最小分辨率是不同的 。为此,作者提出了一种新的动态分辨率网络(DRNet),其中分辨率是根据每个输入样本动态确定的 。

基于此,作者提出了一个具有可忽略计算成本的分辨率预测器,并与分类网络一起进行了优化。在实现上,预测器学习的最小分辨率可以保持甚至超过每个图像原始识别精度。在推断过程中,每个输入图像将调整到其预测的分辨率,以最小化总体计算负担。然后,作者在几个基准网络和数据集上进行了广泛的实验。

结果表明,本文的DRNet可以嵌入任何现成的网络结构中,从而大大降低计算复杂度。例如,与ImageNet上的原始ResNet-50相比,DRNet在计算量减少约34%的情况下实现了类似的性能,而在计算量减少10%的情况下,DRNet的精度提高了1.4%。

论文链接:

https://arxiv.org/abs/2106.02898

为了能够在不同的样本在训练和测试过程中有不同的分辨率,作者提出了一种实例感知分辨率的选择方法。如上图所示,本文的模型主要由两部分组成:用于分类的基础网络 ,如ResNet和EfficientNet,以及分辨率预测器 ,该预测器输出的分辨率在性能和计算上都是高效的。

将一个样本送入改pipeline时,分辨率预测器首先对其进行预处理,并为输入图像输出合适的分辨率r。有了这个合适的分辨率,图像会相应地调整大小,然后被送入基本网络以继续分类。这种方式可以节省大量冗余计算,并保持高性能。分辨率预测器和基础网络在训练过程中进行端到端优化。

内容中包含的图片若涉及版权问题,请及时与我们联系删除