- 简介神经图像压缩取得了很大进展。最先进的模型基于变分自编码器,表现优于传统模型。神经压缩模型学习将图像编码为量化的潜在表示,该表示可以有效地发送到解码器,解码器将量化的潜在表示解码为重构图像。虽然这些模型在实践中证明成功,但由于优化不完美和编码器和解码器容量的限制,它们导致次优结果。最近的研究表明如何使用随机Gumbel退火(SGA)来改善预训练神经图像压缩模型的潜在变量。我们通过引入SGA+来扩展这个想法,其中包含三种不同的方法来构建SGA。此外,我们对我们提出的方法进行了详细的分析,展示了它们如何提高性能,并展示它们对超参数选择的敏感性较小。此外,我们展示了每种方法如何扩展到三类舍入而不是两类舍入。最后,我们展示了使用我们最佳方法对潜在变量进行细化如何提高Tecnick数据集上的压缩性能,以及如何部分地沿着速率失真曲线进行部署。
-
- 图表
- 解决问题本文旨在通过引入三种不同的方法来改进已有的神经图像压缩模型,以进一步提高压缩性能并减少超参数选择的敏感性。
- 关键思路本文提出了SGA+,它是在已有的神经图像压缩模型中使用随机Gumbel退火的改进版本。SGA+包含三种不同的方法,可以进一步优化压缩性能并减少超参数选择的敏感性。
- 其它亮点本文详细分析了SGA+的三种不同方法,并展示了它们如何提高压缩性能以及如何将其推广到三类舍入。实验使用了Tecnick数据集,并展示了SGA+对压缩性能的改进以及如何在部分移动速率失真曲线上部署。
- 最近的研究表明,使用随机Gumbel退火可以优化预先训练的神经图像压缩模型的潜在变量。此外,还有其他研究探索了使用变分自编码器等模型进行神经图像压缩。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流