Collage Diffusion 是一种拼贴条件扩散算法,使用户能生成高质量、多样化的图像,通过将文本提示和 alpha合成RGBA层进行组合,对多物体场景的图像输出进行精确控制。
Collage Diffusion
V Sarukkai, L Li, A Ma, C Ré, K Fatahalian
[Stanford University]
要点:
-
拼贴扩散(Collage Diffusion)是一种拼贴条件扩散算法,使用户能生成高质量、多样化的图像,并对有多个物体场景的图像输出进行精确控制;
-
用户通过定义一个拼贴来控制图像的生成:一个文本提示与一个有序的图层序列配对,其中每一层是一个RGBA图像和一个相应的文本提示;
-
Collage Diffusion 用各层的 alpha 蒙版来修改文本-图像的交叉注意力,并学习每层的专门文本表示,以保持个别拼贴层的特征,而这些特征并非由文本指定;
-
拼贴输入可以实现基于层的控制,对最终输出进行精细控制,允许用户在逐层基础上控制图像的协调性,并在保持其他对象固定的情况下编辑生成的图像中的个别对象。
https://arxiv.org/abs/2303.00262
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢