Robustly overfitting latents for flexible neural image compression

简介

神经图像压缩取得了很大进展。最先进的模型基于变分自编码器，表现优于传统模型。神经压缩模型学习将图像编码为量化的潜在表示，该表示可以有效地发送到解码器，解码器将量化的潜在表示解码为重构图像。虽然这些模型在实践中证明成功，但由于优化不完美和编码器和解码器容量的限制，它们导致次优结果。最近的研究表明如何使用随机Gumbel退火（SGA）来改善预训练神经图像压缩模型的潜在变量。我们通过引入SGA+来扩展这个想法，其中包含三种不同的方法来构建SGA。此外，我们对我们提出的方法进行了详细的分析，展示了它们如何提高性能，并展示它们对超参数选择的敏感性较小。此外，我们展示了每种方法如何扩展到三类舍入而不是两类舍入。最后，我们展示了使用我们最佳方法对潜在变量进行细化如何提高Tecnick数据集上的压缩性能，以及如何部分地沿着速率失真曲线进行部署。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在通过引入三种不同的方法来改进已有的神经图像压缩模型，以进一步提高压缩性能并减少超参数选择的敏感性。
关键思路

本文提出了SGA+，它是在已有的神经图像压缩模型中使用随机Gumbel退火的改进版本。SGA+包含三种不同的方法，可以进一步优化压缩性能并减少超参数选择的敏感性。
其它亮点

本文详细分析了SGA+的三种不同方法，并展示了它们如何提高压缩性能以及如何将其推广到三类舍入。实验使用了Tecnick数据集，并展示了SGA+对压缩性能的改进以及如何在部分移动速率失真曲线上部署。
相关研究

最近的研究表明，使用随机Gumbel退火可以优化预先训练的神经图像压缩模型的潜在变量。此外，还有其他研究探索了使用变分自编码器等模型进行神经图像压缩。

Robustly overfitting latents for flexible neural image compression

提问交流

提问交流