- 简介目前最先进的扩散模型(如Midjourney、Stable Diffusion和Firefly)所呈现的高度逼真的效果,使得未经训练的人类难以区分真实照片和人工智能生成的图像。为了解决这个问题,我们设计了一份指南,帮助读者更加批判地鉴别人工智能生成的图像中常见的瑕疵、不一致性和不合理之处。这份指南分为五类瑕疵和不合理之处:解剖学、风格、功能、物理规律的违反和社会文化。为了编写这份指南,我们生成了138张扩散模型图像,从社交媒体上精选了9张图像,并精选了42张真实照片。这些图像展示了引起怀疑的线索以及为什么仅凭图像像素之外的上下文很难得出关于图像来源的结论。人类可感知的瑕疵并不总是存在于人工智能生成的图像中,但这份指南揭示了经常出现的瑕疵和不合理之处。通过引起人们对这些瑕疵和不合理之处的注意,我们旨在更好地装备人们,以便在未来区分人工智能生成的图像和真实照片。
- 图表
- 解决问题如何识别人工智能生成的图像与真实照片之间的差异?
- 关键思路通过设计一个指南,帮助人们识别人工智能生成图像中的瑕疵和不合理之处,包括解剖学、风格、功能、物理和社会文化等方面,并展示了一些示例图像。
- 其它亮点论文设计了一个指南,展示了人工智能生成图像中的瑕疵和不合理之处,并提供了实例图像。
- 最近的相关研究包括GAN生成图像的研究,如StyleGAN、PGGAN和BigGAN等。


提问交流