昨天,Stability AI带着最新款Stable Diffusion2.1版本来了!
这次发布,距离2.0大版本更新相距不到两周时间。一方面体现了公司效率之高;但另一方面,也暴露了前代模型存在的诸多不足。
本次更新,主要有三大亮点。
减少人像过滤:可以涩涩,但不完全能
但是,许多用户反映,该过滤器过于保守,对于一些模棱两可的图像,只要机器认定是NSFW的内容,就会惨遭「和谐」。
这减少了模型训练数据集中的人物数量,导致用2.0创作的人像图片都显得异常诡异。
StabilityAI听取了用户的反馈,调整过滤器以减少限制。
在与LAION-5B的开发者合作分析了NSFW过滤器及其对训练数据的影响后,将设置调整得更加平衡。
调整后的版本在引入新的提示词的基础上,加入了许多之前版本的提示词,以便在2.0中过滤掉的绝大多数图像重新加入训练数据集,用以训练2.1版本。
但是官方也给各位老司机泼了盆冷水:2.1版本仍然会去除绝大多数成人内容。
毕竟,减少过滤限制是为了提升人像精度。
2.1版本在2.0的模型上进行微调,不仅可以轻松呈现美丽的建筑概念和自然风光,也可以生成人物和流行文化的梦幻形象。
SD2.1下的超级英雄
非标准分辨率图像渲染加强,轻松制作8K大片
该模型还能够渲染非标准分辨率的图像。这可以帮助用户完成各种创举,例如使用极致的纵横比,为用户提供美丽的远景和史诗般的宽屏图像。
2.0版本相较于1.0版本,最大的更新在于生成图像,尤其是建筑概念和自然风光图像的质量。
而2.1版本更是在建筑、室内设计、野生动物和景观场景方面的图像质量上,进行了又一次飞跃。
婆罗洲东马来西亚古代建筑遗址的超现实主义照片
日落时分阿尔卑斯山的山谷,史诗般的远景
古代东京/伦敦/巴黎建筑废墟的超现实主义照片,在被淹没的世界末日景观中陷落的摩天大楼
2.1版本之所以能轻松呈现美丽的建筑概念和自然风光,主要依靠其更长的训练时长。
与模型2.0相比,新版本在LAION数据集上多训练了接近20万个样本。训练数据的增加,大大提升了非标准分辨率图像的渲染能力。
评论
沙发等你来抢