DemoFusion: Democratising High-Resolution Image Generation With No $$$

简介

高分辨率图像生成技术在生成人工智能（GenAI）方面具有巨大潜力，但由于训练所需的巨额资本投入，越来越集中于少数大型企业，并且隐藏在付费墙后面。本文旨在通过推进高分辨率生成的前沿，同时保持对广泛受众的可访问性，使高分辨率GenAI民主化。我们证明现有的潜在扩散模型（LDMs）具有未开发的高分辨率图像生成潜力。我们的新型DemoFusion框架无缝扩展了开源GenAI模型，采用渐进式升级、跳跃残差和扩张采样机制，实现了更高分辨率的图像生成。DemoFusion的渐进性需要更多的传递，但中间结果可以作为“预览”，促进快速的提示迭代。
图表
解决问题

论文试图通过DemoFusion框架来提高高分辨率图像生成的效果，同时使其更加普及和易于使用。作者认为现有的LDM模型在高分辨率图像生成方面还有潜力可以挖掘。
关键思路

DemoFusion框架利用渐进式升采样、跳跃残差和膨胀采样机制来实现高分辨率图像生成。这种渐进式生成的方式虽然需要更多的迭代，但中间结果可以作为“预览”，从而促进快速迭代。
其它亮点

论文使用了开源的GenAI模型，并且提出的DemoFusion框架可以轻松地扩展到这些模型上。作者还使用了多个数据集进行了实验，包括CelebA-HQ，FFHQ，LSUN等，实验结果表明DemoFusion可以在高分辨率图像生成方面取得更好的效果。此外，作者还开源了DemoFusion框架的代码，使得更多的研究者可以使用和改进该方法。
相关研究

最近在这个领域中，还有其他的高分辨率图像生成方法，如StyleGAN2，BigGAN，等等。

DemoFusion: Democratising High-Resolution Image Generation With No $$$

评论