文件更小，质量更高，大火的Stable Diffusion还能压缩图像？

近来，Stable Diffusion 成为一个新兴的研究方向。一位名为 Matthias Bühlmann 的博主尝试实验探究这种模型的强大功能，结果发现 Stable Diffusion 是一个非常强大的有损图像压缩编解码器。他撰写了一篇博客描述了这个实验分析过程，以下是博客原文。

首先 Matthias Bühlmann 给出在高压缩因子条件下，Stable Diffusion 方法与 JPG、WebP 的压缩结果，所有结果都是 512x512 像素的分辨率：

旧金山风景图，从左至右：JPG (6.16kB), WebP (6.80kB), Stable Diffusion: (4.96kB)。

糖果店，从左至右：JPG (5.68kB), WebP (5.71kB), Stable Diffusion (4.98kB)。

动物照片，从左至右：JPG (5.66kB), WebP (6.74kB), Stable Diffusion (4.97kB)。

这些例子明显表明，与 JPG 和 WebP 相比，使用 Stable Diffusion 压缩图像可以在更小的文件大小下保留更出色的图像质量。

探究实验

Matthias Bühlmann 分析了一下其中的工作原理，Stable Diffusion 使用三个串联的训练好的人工神经网络：

VAE 将图像空间中的图像编码和解码为某种潜在的空间表征。源图像（512 x 512，3x8 或 4x8 bit）的潜在空间表征会分辨率更低（64 x 64）、精度更高（4x32 bit）。

内容中包含的图片若涉及版权问题，请及时与我们联系删除