- 简介随着生成模型的迅速发展,区分人工智能生成的内容已引起行业和学术界的越来越多的关注。本文对“是否解决了人工智能生成图像检测任务”进行了一次健全性检查。首先,我们提出了Chameleon数据集,其中包含了对人类感知真正具有挑战性的人工智能生成图像。为了量化现有方法的泛化能力,我们在Chameleon数据集上评估了9个现成的人工智能生成图像检测器。经过分析,几乎所有的模型都将人工智能生成的图像分类为真实的图像。随后,我们提出了AIDE(具有混合特征的人工智能生成图像检测器),它利用多个专家同时提取视觉特征和噪声模式。具体而言,为了捕捉高层次的语义,我们利用CLIP计算视觉嵌入。这有效地使模型能够根据语义或上下文信息区分人工智能生成的图像;其次,我们选择图像中最高频率的补丁和最低频率的补丁,并计算低层次的补丁特征,旨在通过低层次的特征,例如噪声模式和抗锯齿等,检测人工智能生成的图像。在评估现有的基准测试数据集,例如AIGCDetectBenchmark和GenImage时,AIDE相对于现有的最先进方法分别实现了+3.5%和+4.6%的提高,并且在我们提出的具有挑战性的Chameleon基准测试数据集上也取得了令人满意的结果,尽管这个检测人工智能生成图像的问题还远未得到解决。数据集、代码和预训练模型将在https://github.com/shilinyan99/AIDE上发布。
- 图表
- 解决问题论文旨在检验AI生成图像检测是否已经得到解决。
- 关键思路提出了AIDE(AI生成图像检测器),利用多个专家同时提取视觉特征和噪声模式,通过高级语义和低级特征两个方面判断AI生成的图像。
- 其它亮点提出了新的数据集Chameleon,评估了9个AI生成图像检测器,发现几乎所有模型都将AI生成的图像误判为真实图像。AIDE在多个基准测试中均取得了优异的成绩,并在Chameleon数据集上也表现出良好的性能。
- 最近的相关研究包括:《Generative Adversarial Text to Image Synthesis》、《Detecting GAN-generated Fake Images using Co-occurrence Matrices of Color Channels》。
沙发等你来抢
去评论
评论
沙发等你来抢