NeurIPS'25竞赛评述 | 面向AI生成人脸检测的公平性竞赛: 方法与实验结果

借助先进生成模型，人工智能人脸合成技术(深度伪造)发展迅猛，能够生成高度逼真的篡改影像，这类伪造内容与真实素材的区分难度持续攀升。滥用该类技术会损害公众信任、破坏民主秩序，在敏感场景下危害尤为突出。除检测精度外，负责任的取证分析还要求技术落地秉持公平与伦理准则。然而现有研究表明，各类检测算法在不同人群上的识别效果存在显著差异，现有技术尚未妥善解决该问题；同时各类公平性优化方案，在数据分布发生偏移时往往难以维持稳定效果。为攻克这一难题，美国普渡大学胡暑助理教授领衔在2025年NeurIPS主办了首届聚焦人工智能人脸检测公平性的竞赛，将公平性相关研究与现实中的深度伪造鉴别难题相结合。

图片来自Springer

全文下载：

The Competition of Fairness in AI-generated Face Detection: Methods and Results

Shu Hu, Li Lin...Ting-Wan Kao

https://link.springer.com/article/10.1007/s11633-026-1637-x

全文导读

本次竞赛吸引了全球大量研究者参与：共有来自20个国家、63家机构的64支注册队伍、158名参赛者，其中11支队伍的模型性能超越基准算法。对参赛方案的分析显示，效果最优的方法并非单纯依靠公平性约束，而是融合了以数据为核心的设计、鲁棒表征学习与多模型差异化融合三大思路。其中排名第一的方案通过精细化数据筛选、混合专家模型架构以及测试时数据增广，大幅提升了模型公平性；该方案证明，无需针对特定人群设计专属损失函数，也能提升公平性的泛化能力。其余优质参赛方案从不同互补角度展开探索，包括基于基础大模型的特征提取、全局与局部特征双分支融合、集成学习、事后校准等，各类方案在公平性、检测实用性与工程落地性之间各有取舍。本次研究结果表明，通过系统化的策略设计能够显著优化模型公平性指标，同时也暴露了现有评测标准存在缺陷，以及固定阈值下模型易出现低效简化方案的风险。总体而言，本次竞赛为构建更公平、鲁棒、可信的深度伪造检测系统提供了详实的实证依据与方法论参考，也为后续基准数据集、评测指标设计及合规落地规范给出指导。

竞赛官网：

https://sites.google.com/view/aifacedetection/

基于变分自编码器、生成对抗网络、扩散模型等深度神经网络生成式人工智能先进技术打造的AI人脸生成技术(又称深度伪造技术DeepFake)，可在未经当事人许可的情况下，将视频图像中的目标人物面部替换为他人人脸，生成高度逼真的图像与视频。

如今这类技术已发展到能够精准复刻人类五官特征与面部表情的水平，普通民众越来越难以分辨真实影像与篡改伪造内容。在各类敏感场景中，AI换脸技术遭滥用的潜在风险尤为令人警惕，例如2024年美国总统大选相关事件，或是针对泰勒・斯威夫特等公众人物制作伪造影像的案例。深度伪造能够生成极具迷惑性的虚假内容、误导大众认知，这对民主制度的公信力以及个人名誉都构成了严重威胁。因此，开展深度伪造检测工作至关重要：此举不仅能够打击虚假信息，更有助于维系社会对信息传播环境的信任。

治理深度伪造技术需要一套综合性应对方案，其范畴远不止单纯的伪造内容检测，核心在于对生成式人工智能技术进行合规可控的设计、研发与落地应用。

该研究领域也被称作负责任数字取证，核心是以合乎伦理规范的方式将取证科学应用于数字内容鉴别，确保所有识别、遏制深度伪造内容的相关举措均恪守高标准伦理准则、充分尊重人权。公平性是负责任数字取证的核心要义，这一点在生成式人工智能领域尤为关键。检测工具的研发与落地使用，必须规避针对特定个体或群体产生无意识偏见，以此维护数字空间内的公平正义。已有多项近期研究证实，深度伪造检测算法普遍存在偏见问题：例如模型对浅肤色人群的伪造样本识别准确率更高（见图 1 (b)）；但现有解决方法很少深入剖析这类偏见的内在成因。深度伪造检测体系中的公平缺失，会造成失衡的伤害后果：这类系统本用于防范网络诈骗、性剥削、政治干预，最终却给少数群体、弱势社群带来更沉重的负面影响。举例而言，若模型对特定人群误报率偏高，会引发过度监控、错误下架合规内容、不实指控等问题；而算法在不同地区表现参差不齐，则会削弱小众国家抵御定向虚假信息攻势的防护能力。此类性能差异非但无法缓解AI伪造媒体带来的危害，反而会进一步加剧原本就存在的社会与政治不平等。

360截图20260617111642065.jpg

图1 深度伪造检测中的公平性难题，红色方框标注出模型的错误预测结果。

尽管机器学习领域已提出大量公平性算法用以缓解上述偏见问题，但这类算法在深度伪造检测任务中的实际落地应用仍十分有限。此外，若不加策略规划、简单粗暴地将公平性技术嵌入深度伪造检测模型，当不可避免的数据分布偏移发生时，往往难以维持稳定可靠的公平表现；考虑到生成式AI模型迭代更新速度极快，该问题尤为关键。举例来说，新型生成模型产出的合成内容常会与训练数据存在巨大差异，进而破坏模型公平性的泛化能力。

为此，我们在NeurIPS 2025上举办了首届聚焦AI人脸伪造检测公平性的专项竞赛，旨在将公平机器学习领域的前沿研究成果与计算机视觉领域的现实难题相结合。本次竞赛有望催生全新研究方向、推动跨学科协作，并引导业界研发公平性更优的AI人脸伪造检测系统。其更深远的价值在于推动人工智能技术合规落地、削减算法偏见，同时提升公众对媒体真伪鉴别体系的信任度。

本次竞赛设立多重目标：提升学界与业界对AI生成媒体及其安全领域存在的公平性难题与优化空间的认知，并推动各界开展交流研讨，进而产出创新解决方案，形成面向负责任设计、研发与落地应用的规范指南。本次竞赛获得全球广泛关注，共有来自20个国家63家机构的 64支队伍完成报名，参赛人员总计158人。最终有11支队伍的模型效果优于官方给出的基准算法，登上竞赛排行榜。

本文全面总结本次竞赛，涵盖赛事筹备工作与竞赛结果。论文其余章节安排如下：第2章详细介绍本次竞赛的整体设计与架构；第3章对各参赛方案展开分析、对比模型性能，并提炼核心研究结论；第4章简要介绍性能优于基准模型的各参赛队伍所提出的算法方案；最后，第5章对全文进行总结。

讨论与结论

通过筹办本次AI人脸伪造检测公平性竞赛，我们从赛事结果中收获诸多重要结论，具体如下：

1）本次竞赛获得了全球范围内的广泛关注，共有来自20个国家的64支队伍完成注册。即便报名截止日期过后，我们仍持续收到报名申请。为保证赛事公平性，我们并未接纳逾期报名的队伍参与本次竞赛，不过这也促使我们计划在近期举办第二届AI-Face专项竞赛。

2）通过分析顶尖参赛队伍的实验结果，我们意识到需要重新思考如何避免参赛队伍为追求优异的公平性指标，却牺牲模型实际可用性能。一种可行思路是设计加权评测指标，同步兼顾模型可用性与公平性表现；另一种方案是采用帕累托前沿分析，直观量化可用性与公平性二者间的取舍关系。在该评测框架下，每支队伍可基于不同训练阶段，在测试集上提交多组（可用性、公平性）性能数据，以此绘制二者的权衡曲线。依托这些曲线，我们能够搭建一套排名规则，筛选出在可用性与公平性之间实现均衡且稳定表现的参赛方案。举例来说，可在统一模型可用性水平下对比各队伍，将其平均公平性表现作为排名依据。

3）绝大多数参赛队伍的AUC指标均优于赛事提供的基准模型，这说明我们选用的基准模型结构过于简易。基于此，我们计划引入性能更先进的基准模型，以此提升下一届竞赛的挑战难度。

4）先系统性梳理训练数据集的优势与短板，再开展精细化数据筛选处理，是多数队伍采用的通用方案。其中，蚂蚁集团、AIST-ICT、CAU-KETI三支队伍通过分析不同来源伪造样本的数据分布，以此指导自身的数据预处理与模型训练流程。值得一提的是，Entrust队伍对测试集展开深度分析，推断出样本类别标签与人群分组标签，该分析结果极大优化了其最终模型设计。

5）多支队伍并未采用单一模型，而是选用混合专家模型架构（蚂蚁集团、AI-Hunter、ICI Innolabs、kunkun 队伍）并搭配数据增广策略（蚂蚁集团、Entrust、AIST-ICT、ICI Innolabs 队伍）。实验结果证明，这类组合方案效果显著，能够有效提升模型综合性能。

6）多支队伍借助基础大模型提取精度更高、泛化迁移能力更强的特征表征，显著提升了模型整体性能。例如，Entrust队伍与CAU-KETI队伍采用最新的CLIP模型，AI-Hunter队伍则选用DINOv3模型。

7）多支队伍在模型训练阶段，使用外部数据集对赛事提供的数据集进行扩充。例如蚂蚁集团引入了公开的真实人脸数据集与深度伪造数据集，ICI Innolabs队伍额外采用了来自Kaggle 平台的深度伪造数据集。该策略能够有效提升训练后模型的泛化能力。

总体而言，本次竞赛涌现出多种多样的创新方案，从数据预处理策略到全新模型架构设计，各类方法均以提升AI人脸伪造检测的公平性为目标，成果令人振奋。与此同时，赛事也暴露出若干亟待深入研究的关键难题，具体如下：

1）如何避免参赛队伍推导测试集标签，这一问题仍有待深入研究。Entrust队伍提到，本次测试集的真实标签可通过图像文件名轻易识别，在后续赛事设计中需要修复该漏洞。

2）尽管各参赛队伍相比基准模型均实现了公平性指标提升，但AI人脸伪造检测的公平性问题尚未得到彻底解决，如何在模型实用性能与公平性之间实现有效平衡仍是一大开放性难题。

3）可进一步优化竞赛任务设定与评价指标，遏制那些以牺牲实用性能为代价换取公平性提升的浅层简易方案，引导研究者提出更贴合实际落地场景的算法。

4）竞赛期间我们与各顶尖队伍交流了他们的参赛方案，部分队伍提到借助后处理技术进一步优化公平性。这也促使我们深入探讨：是否允许使用此类后处理手段、以及如何规范使用规则，从而保障公平、有意义的横向对比。

5）为催生更多前沿创新方案，未来竞赛可进一步提升难度，例如不再局限于人脸图像，拓展至更广的视觉场景，同时明确考核模型在人脸与其他类别图像上的性能取舍关系。

以上方向均留作后续研究工作。我们将持续优化赛事设计、扩大赛事影响力，最终推动面向 AI 伪造媒体治理的公平、合规人工智能技术发展。本文所得结论具备实质性参考价值，可为本领域及其他方向的赛事主办方提供借鉴。

全文下载：

The Competition of Fairness in AI-generated Face Detection: Methods and Results

Shu Hu, Li Lin, Shail Desai, Aditya Pawar, Guangyu Lin, Xin Wang, Daniel S. Schiff, Sachi Nandan Mohanty, Ryan Ofman, Narcis Bejtic, Jon Gillham, Wenbin Zhang, Baoyuan Wu, Cristian Canton, Xiaoming Liu, Luisa Verdoliva, Siwei Lyu, Yongwei Tang, Zhiqiang Wu, Jiawen Seow, Zara Alaverdyan, Anne-Flore Baron, Simon Bozonnet, Martins Bruveris, Jochem Gietema, Lucia Innocenti, Lisa Ivanova, Olivier Koch, Harry Ni, Arthur Pajot, Romain Sabathe, Fengming Gu, Xingming Long, Jie Zhang, Wenqing Ge, Xiangkui Cao, Yuecong Min, Yingjie Liu, Zonghui Guo, Shiguang Shan, Jinhee Park, Minjun Kim, Ahyeon Park, Guisik Kim, Taewoo Kim, YoungJoon Yoo, Junseok Kwon, Zhaoda Li, Mengyun Tang, Leyang Huang, Bogdan Dura, Sebastian Balmuş, Fang-Yi Su, Tsung-Hua Lee & Ting-Wan Kao

https://link.springer.com/article/10.1007/s11633-026-1637-x

BibTex:

@Article {MIR-2026-01-033,

author={Shu Hu, Li Lin, Shail Desai, Aditya Pawar, Guangyu Lin, Xin Wang, Daniel S. Schiff, Sachi Nandan Mohanty, Ryan Ofman, Narcis Bejtic, Jon Gillham, Wenbin Zhang, Baoyuan Wu, Cristian Canton, Xiaoming Liu, Luisa Verdoliva, Siwei Lyu, Yongwei Tang, Zhiqiang Wu, Jiawen Seow, Zara Alaverdyan, Anne-Flore Baron, Simon Bozonnet, Martins Bruveris, Jochem Gietema, Lucia Innocenti, Lisa Ivanova, Olivier Koch, Harry Ni, Arthur Pajot, Romain Sabathe, Fengming Gu, Xingming Long, Jie Zhang, Wenqing Ge, Xiangkui Cao, Yuecong Min, Yingjie Liu, Zonghui Guo, Shiguang Shan, Jinhee Park, Minjun Kim, Ahyeon Park, Guisik Kim, Taewoo Kim, YoungJoon Yoo, Junseok Kwon, Zhaoda Li, Mengyun Tang, Leyang Huang, Bogdan Dura, Sebastian Balmuş, Fang-Yi Su, Tsung-Hua Lee, Ting-Wan Kao},

journal={Machine Intelligence Research},

title={The Competition of Fairness in AI-generated Face Detection: Methods and Results},

year={2026},

volume={23},

issue={3},

pages={501-527},

doi={10.1007/s11633-026-1637-x}}

特别感谢本文第一作者、普渡大学胡暑老师对以上内容的审阅和修改！

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务，如您对本篇文章感兴趣，请点击下方链接填写收件地址，编辑部将尽快为您免费寄送纸版全文！

说明：如遇特殊原因无法寄达的，将推迟邮寄时间，咨询电话010-82544737

收件信息登记：

https://lcn76mgd97vz.feishu.cn/share/base/form/shrcnsQ6cmRjqoxPF5WDowSBFVr

内容中包含的图片若涉及版权问题，请及时与我们联系删除

NeurIPS'25竞赛评述 | 面向AI生成人脸检测的公平性竞赛: 方法与实验结果

评论列表

评论