扩散模型的图像生成统治地位,终于要被GAN夺回了?
就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的StyleGAN-T,一下子在网上火了。
只需要接近0.1秒就能生成!
同等算力下,扩散模型中的Stable Diffusion生成一张图片需要3秒钟,Imagen甚至需要接近10秒。
论文地址:https://arxiv.org/abs/2301.09515
项目地址:https://github.com/autonomousvision/stylegan-t
StyleGAN-XL的参数量是StyleGAN3的3倍,基于ImageNet训练,能生成1024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。
它的整体架构如下:
评论
沙发等你来抢