AI imager Midjourney v5 stuns with photorealistic images—and 5-fingered hands “缺乏多巴胺来袭,因为每次的结果都太完美了。”

来自:本杰·爱德华兹


周三,Midjourney宣布了其商业 AI 图像合成服务的第 5 版,该服务可以生成栩栩如生的图像,其质量水平被一些 AI 艺术爱好者称为令人毛骨悚然且“过于完美”。Midjourney v5 现在作为 alpha 测试提供给订阅 Midjourney 服务的客户,该服务可通过 Discord 获得。

推特地址:

https://twitter.com/midjourney/status/1636130389365497857?cxt=HHwWgoDRhfX62bQtAAA

Midjourney官网:

https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F

 

V5 主要新功能:

- 更广泛的样式范围和更灵敏的提示语

- 更高的图像质量,改进的动态范围

- 更详细的图像,更正确的细节。 可以减少不需要的文本提示。

- 改进的图像提示。

- 支持无缝平铺的 --tile 参数

- 支持 --ar 宽高比大于 2:1

- 支持 --iw 在图像提示与文本提示之间的权重

- 它比 v3 和 v4 更“不拘一格”,并且经过调整可以提供更广泛多样的输出并对输入做出非常敏感的反应。

- 该模型可以生成比之前发布的任何模型都更加逼真的图像。

- V5 使用截然不同的神经结构和新的美学技术,希望能感受到人类集体想象力中某种深刻而深不可测的事物的进展。

“MJ v5 目前对我来说感觉像是在忽视视力不好太久之后终于戴上了眼镜,”经常在 Twitter 上分享她的 Midjourney 创作的平面设计师 Julie Wieland 说。“突然间你看到了 4k 的一切,感觉不可思议但又令人惊叹。”

Midjourney 的工作原理类似于Stable Diffusion和DALL-E等图像合成器,因为它使用经过数百万人造艺术作品训练的 AI 模型,根据称为“提示”的文本描述生成图像。最近,Midjourney 处于版权争议的中心,该争议涉及一本使用该服务早期版本的漫画书。

在对 v5 进行了一天的试验后,Wieland 注意到改进之处包括“极其逼真的”皮肤纹理和面部特征;更逼真的或电影照明;更好的反射、眩光和阴影;更具表现力的角度或场景概览,以及“近乎完美且不再摇摇晃晃的眼睛”。

当然,还有手。

在过去的一年里,人工智能艺术生成器无法正确渲染手的想法已经成为一种文化修辞。值得注意的是,Midjourney v5 可以很好地生成逼真的人手。“大多数时候,手是正确的,一只手有 5 个手指,而不是 7-10 个,”维兰德说。

在该服务的 Discord 发行说明中,Midjourney 还指出,v5 现在的响应比版本 4 具有“更广泛的风格范围”,同时对提示更加敏感,生成的不需要的文本更少,图像分辨率提高了 2 倍。

如果 AI 艺术爱好者的 Midjourney 升级有视觉上的缺点,它可能来自图像如此逼真和“完美”,以至于模型的精度带走了一些重复生成 AI 图像以找到合适结果的快感,什么人们可能称之为“老虎机效应​​”。尽管一位名叫 Philipp Lenssen 的 Twitter 用户指出,“如果你有一个特定的图像主题,它仍然有点像彩票。但中奖机会比 v4 更高。”

内容中包含的图片若涉及版权问题,请及时与我们联系删除