- 简介学习图像压缩(LIC)在客观和主观指标方面取得了巨大进展。基于MSE的模型旨在提高客观指标,而生成模型则被用于提高主观指标下的视觉质量。然而,它们在低比特率下,特别是在0.2bpp以下,都会出现模糊或变形的问题。此外,人脸和文本上的变形对于视觉质量评估是不可接受的,并且在小脸和文本上问题变得更加突出。为了解决这个问题,我们结合了基于MSE的模型和生成模型的优点,利用感兴趣区域(ROI)提出了分层ROI(H-ROI),将图像分成几个前景区域和一个背景区域,以提高包含人脸、文本和复杂纹理的区域的重建。此外,我们提出了通道维度内的非线性映射自适应量化,以限制比特率同时保持视觉质量。详尽的实验表明,我们的方法在小脸和文本上实现了更好的视觉质量,比如HiFiC的0.7X比特和BPG的0.5X比特。
-
- 图表
- 解决问题论文旨在解决低比特率下,图像压缩中面部和文字出现模糊变形的问题。
- 关键思路论文提出了一种利用ROI和自适应量化的图像压缩方法,将图像分为前景和背景区域,提高了包含人脸、文本和复杂纹理的区域的重建质量。
- 其它亮点论文提出的H-ROI方法在小人脸和文本的低比特率下实现了更好的视觉质量,比HiFiC和BPG的比特率分别低了0.7倍和0.5倍;采用非线性映射的自适应量化方法在保持视觉质量的同时控制了比特率。实验使用了多个数据集,并提供了开源代码。
- 与本文相关的研究包括:1. Learning-based image compression with bit-depth scaling and Huffman coding;2. End-to-end optimized image compression with generative adversarial networks;3. A deep convolutional neural network for image compression
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流