Fake or JPEG? Revealing Common Biases in Generated Image Detection Datasets

向作者提问

NEW

简介

广泛采用生成图像模型凸显了检测人工内容的紧迫需求，这是打击广泛操纵和错误信息的关键步骤。因此，出现了许多检测器和相关数据集。然而，许多这些数据集无意中引入了不良偏差，从而影响了检测器的有效性和评估。本文强调，许多用于AI生成图像检测的数据集包含与JPEG压缩和图像大小相关的偏差。使用GenImage数据集，我们证明检测器确实从这些不良因素中学习。此外，我们还展示了去除这些偏差可以显著提高对JPEG压缩的鲁棒性，并显著改变评估检测器的跨生成器性能。具体而言，这导致ResNet50和Swin-T检测器在GenImage数据集上的跨生成器性能增加了超过11个百分点，实现了最先进的结果。我们在匿名网站https://www.unbiased-genimage.org上提供了本文的数据集和源代码。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

检测人工智能生成的图像中的人为内容，以应对广泛的操纵和误导，但当前很多数据集存在不良偏差，影响检测器的有效性和评估。
关键思路

论文指出许多人工智能生成图像检测的数据集存在与JPEG压缩和图像大小相关的偏差，这些偏差会影响检测器的学习和评估，因此提出一种方法来消除这些偏差，从而提高检测器的鲁棒性和跨生成器性能。
其它亮点

论文使用GenImage数据集进行实验，证明检测器确实会从JPEG压缩和图像大小等不良因素中学习。通过消除这些偏差，ResNet50和Swin-T检测器在GenImage数据集上的跨生成器性能提高了超过11个百分点，达到了最先进的水平。论文提供了数据集和源代码，可供研究者使用。
相关研究

最近的相关研究包括：《Learning to Detect Fake Face Images in the Wild》、《FakeCatcher: Detection of Synthetic Portrait Videos using Biological Signals》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问