Fake or JPEG? Revealing Common Biases in Generated Image Detection Datasets

2024年03月26日
  • 简介
    广泛采用生成图像模型凸显了检测人工内容的紧迫需求,这是打击广泛操纵和错误信息的关键步骤。因此,出现了许多检测器和相关数据集。然而,许多这些数据集无意中引入了不良偏差,从而影响了检测器的有效性和评估。本文强调,许多用于AI生成图像检测的数据集包含与JPEG压缩和图像大小相关的偏差。使用GenImage数据集,我们证明检测器确实从这些不良因素中学习。此外,我们还展示了去除这些偏差可以显著提高对JPEG压缩的鲁棒性,并显著改变评估检测器的跨生成器性能。具体而言,这导致ResNet50和Swin-T检测器在GenImage数据集上的跨生成器性能增加了超过11个百分点,实现了最先进的结果。我们在匿名网站https://www.unbiased-genimage.org上提供了本文的数据集和源代码。
  • 作者讲解
  • 图表
  • 解决问题
    检测人工智能生成的图像中的人为内容,以应对广泛的操纵和误导,但当前很多数据集存在不良偏差,影响检测器的有效性和评估。
  • 关键思路
    论文指出许多人工智能生成图像检测的数据集存在与JPEG压缩和图像大小相关的偏差,这些偏差会影响检测器的学习和评估,因此提出一种方法来消除这些偏差,从而提高检测器的鲁棒性和跨生成器性能。
  • 其它亮点
    论文使用GenImage数据集进行实验,证明检测器确实会从JPEG压缩和图像大小等不良因素中学习。通过消除这些偏差,ResNet50和Swin-T检测器在GenImage数据集上的跨生成器性能提高了超过11个百分点,达到了最先进的水平。论文提供了数据集和源代码,可供研究者使用。
  • 相关研究
    最近的相关研究包括:《Learning to Detect Fake Face Images in the Wild》、《FakeCatcher: Detection of Synthetic Portrait Videos using Biological Signals》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问