稳定扩散重塑

StabilityAI很高兴地宣布推出Stability Diffusion Reimagine!我们邀请用户通过Stable Diffusion对图像进行实验,并“重新构想”他们的设计。

Stable Diffusion Reimagine是一款新的剪贴画工具,允许用户无限制地生成单个图像的多种变体。不需要复杂的提示:用户只需将图像上传到算法中,即可创建任意数量的变体。

在下面的例子中,左上角的图像是输入到工具中的原始文件,而其他图像是受原始文件启发的“重新想象”的创作。

您的卧室只需点击一个按钮即可进行改造:

你还可以玩时尚造型,还有更多:

Clipdrop还具有放大功能,允许用户上传一张小图像,并生成一张至少有两倍细节的图像。

用途和限制

稳定扩散重新想象不会重新创建由原始输入驱动的图像。相反,Stable Diffusion Reimagine以原创作品为灵感,创造新的图像。

这项技术有已知的局限性:它可以根据一些图像激发惊人的结果,而对其他图像产生不那么令人印象深刻的结果。

我们在模型中安装了一个过滤器来阻止不适当的请求,但过滤器有时会出现假阴性或假阳性。

该模型有时也可能产生异常结果或表现出有偏差的行为。我们渴望收集用户反馈,以帮助我们正在进行的改进该系统和缓解这些偏见的工作。

技术

Stable Diffusion Reimagine基于stability.ai创建的一种新算法。经典的文本到图像稳定扩散模型被训练为以文本输入为条件。

此版本将原始文本编码器替换为图像编码器。代替基于文本输入生成图像,而是从图像生成图像。在编码器通过算法之后,添加一些噪声以产生变化。

这种方法产生具有不同细节和构图的相似图像。与图像对图像算法不同,源图像首先被完全编码。这意味着生成器不使用来自原始图像的单个像素。

Stable Diffusion Reimagine的模型将很快在StabilityAI的GitHub中开源。

关于/stability.ai

网址:https://stability.ai/

来自官网介绍:

我们是世界领先的开源生成人工智能公司

我们的目标是最大限度地利用现代人工智能来激发全球创造力和创新。

自2021启动我们的人工智能倡议以来,我们已经在全世界聚集了超过140000名开发人员和七个研究中心。

我们坚信,我们的开源精神为尖端研究的创建和获取提供了明确的途径。稳定人工智能支持的研究社区目前正在开发突破性的人工智能模型,应用于成像、语言、代码、音频、视频、3D内容、设计、生物技术和其他科学研究。

我们与亚马逊网络服务公司的合作为我们提供了世界第五大超级计算机——Ezra-1 UltraCluster——为实现这些进步提供了必要的电力。