DemoFusion: Democratising High-Resolution Image Generation With No $$$

Ruoyi Du,
Dongliang Chang,
Timothy Hospedales,
Yi-Zhe Song,
Zhanyu Ma
CV
AI
ML
2023年11月24日
  • 简介
    高分辨率图像生成技术在生成人工智能(GenAI)方面具有巨大潜力,但由于训练所需的巨额资本投入,越来越集中于少数大型企业,并且隐藏在付费墙后面。本文旨在通过推进高分辨率生成的前沿,同时保持对广泛受众的可访问性,使高分辨率GenAI民主化。我们证明现有的潜在扩散模型(LDMs)具有未开发的高分辨率图像生成潜力。我们的新型DemoFusion框架无缝扩展了开源GenAI模型,采用渐进式升级、跳跃残差和扩张采样机制,实现了更高分辨率的图像生成。DemoFusion的渐进性需要更多的传递,但中间结果可以作为“预览”,促进快速的提示迭代。
  • 图表
  • 解决问题
    论文试图通过DemoFusion框架来提高高分辨率图像生成的效果,同时使其更加普及和易于使用。作者认为现有的LDM模型在高分辨率图像生成方面还有潜力可以挖掘。
  • 关键思路
    DemoFusion框架利用渐进式升采样、跳跃残差和膨胀采样机制来实现高分辨率图像生成。这种渐进式生成的方式虽然需要更多的迭代,但中间结果可以作为“预览”,从而促进快速迭代。
  • 其它亮点
    论文使用了开源的GenAI模型,并且提出的DemoFusion框架可以轻松地扩展到这些模型上。作者还使用了多个数据集进行了实验,包括CelebA-HQ,FFHQ,LSUN等,实验结果表明DemoFusion可以在高分辨率图像生成方面取得更好的效果。此外,作者还开源了DemoFusion框架的代码,使得更多的研究者可以使用和改进该方法。
  • 相关研究
    最近在这个领域中,还有其他的高分辨率图像生成方法,如StyleGAN2,BigGAN,等等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论