微博@Simon_阿文在游戏葡萄直播中,对最近AI图片和视频生成的总结分享,从用户、设计师的视角,对研发同学应该有一定参考价值。

对知名项目的评价:

初代DALL·E画的是梗图。

Disco Diffusion纯代码界面、部署在Google上,所以用户友好度并不那么高。出图慢。

MidJourney:甚至不用调教,它就能生成非常美观的图片。最直观的特点就是「快」。同样一句话,它在1~2分钟内就能很好地生成结果。

DALL·E 2评价几乎是满星的,无论是友好度、生成速度、精准度还是艺术性。但是太贵。精准的理解力,使它有可能是「乙方设计师的终极形态」。

Imagen:前所未有的写实感和深度的语言理解。

Parti, Make a scene, NUWA:都是DALL·E加强版。没有一家开放内测。他们只是跑出来发一篇论文或是发表一些demo,就没有下文了。

Stable Diffusion:最初对它的形容是「目前AI绘画的王者」。开源,而且语言和风格的理解能力很夸张。Stable Diffusion的开源,其实宣告了诸神之战第一阶段的结束。

关于第一阶段的工具,我比较推荐Stable Diffusion、MidJourney和DALL·E,其中MidJourney是设计师必修的工具。

此外面对目前各种插件,建议多关注大厂(Adobe、微软、Google等)。

视频生成方面,Meta的Make a video,Google的Imagen视频版和Phenaki。

内容中包含的图片若涉及版权问题,请及时与我们联系删除