2DQuant: Low-bit Post-Training Quantization for Image Super-Resolution

2024年06月10日
  • 简介
    低比特量化已经广泛应用于压缩图像超分辨率(SR)模型,以便在边缘部署时,先进的SR模型能够享受到紧凑的低比特参数和高效的整数/位运算构造,以实现存储压缩和推理加速。然而,众所周知,与全精度(FP)对应物相比,低比特量化会降低SR模型的准确性。尽管已经做出了几项缓解措施,但基于变压器的SR模型仍然因其独特的激活分布而遭受严重的降级。在这项工作中,我们提出了一种针对图像超分辨率的双阶段低比特后训练量化(PTQ)方法,即2DQuant,它在低比特量化下实现了高效和准确的SR。所提出的方法首先研究了权重和激活,并发现其分布具有共存的对称性和不对称性、长尾特征。具体而言,我们提出了面向分布的边界初始化(DOBI),使用不同的搜索策略来搜索量化器的粗略边界。为了获得精细的量化器参数,我们进一步提出了蒸馏量化校准(DQC),它采用蒸馏方法使量化模型从其FP对应物中学习。通过对不同位数和缩放因子进行广泛的实验,DOBI的性能可以达到最新技术水平(SOTA),而经过第二阶段后,我们的方法在两个指标和视觉效果上均超过了现有的PTQ。2DQuant在量化为2比特时,与SOTA相比,在Set5(x2)上的PSNR增加高达4.52dB,同时获得3.60x的压缩比和5.08x的加速比。代码和模型将在https://github.com/Kai-Liu001/2DQuant上提供。
  • 图表
  • 解决问题
    论文旨在解决低比特量化对于图像超分辨率模型精度的影响问题,提出了一种双阶段低比特后训练量化方法。
  • 关键思路
    论文提出了Distribution-Oriented Bound Initialization和Distillation Quantization Calibration两种方法,分别用于搜索量化器的粗略边界和细化量化器参数,通过对称性和不对称性的结合以及长尾分布的特点,实现了高效和准确的超分辨率。
  • 其它亮点
    论文在不同比特和缩放因子下进行了大量实验,表明该方法在PSNR和视觉效果方面都超过了现有的后训练量化方法,并且具有3.60倍的压缩比和5.08倍的加速比。研究者还提供了代码和模型。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如《Deep Residual Learning for Image Super-Resolution》、《Learning a Deep Convolutional Network for Image Super-Resolution》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论