阿里安全荣获第六届中国人工智能大赛AI安全方向三个赛道A奖

近日，由国家互联网信息办公室、公安部指导，厦门市人民政府主办，厦门市数据管理局、厦门市互联网信息办公室、厦门市公安局、厦门市工业和信息化局联合承办的，以“融新汇智竞促发展”为主题的第六届中国人工智能大赛配套论坛在厦门成功举办。

在此次比赛中，共吸引到700多支队伍报名参赛，阿里巴巴集团安全部参加其中AI安全方向的3个赛道「AIGC音频检测」、「AIGC视频检测」、「AIGC标识提取、溯源案例」，均获得最高级别的A级证书。

这已是阿里安全连续第二年在此项国家级赛事中斩获最高荣誉。继去年在「AIGC音频检测」赛道和「人工智能显式内容标识提取技术」赛道获奖后，今年的“三A”认证不仅是荣耀的蝉联，更是技术实力的全面跨越——标志着我们已从单点领先，发展为在AIGC安全领域的全面领跑。时间的推移印证了我们持续引领的技术创新与成果产出。

本文将围绕以下三项核心成果展开论述👇

方案简介

针对AIGC音频检测任务，团队首先通过收集与制作整理了千万级别的音频生成合成检测数据集，数据集包含文生音频（TTS，TextToSpeech）、语音克隆（Voice Clone）、语音转换（Voice Conversion）、语音翻录（Replay）等大规模开源模型生成合成伪造音频以及各类公开学术数据集中的真伪样本，以及内部真实业务提供的数据集。整体方案基于预训练音频大模型（诸如WavLM、Wav2Vec2和HuBERT等）微调训练而成，可以支持检测包含文生音频、变音和声音克隆等AI生成音频以及音频翻录等物理合成音频。

本次比赛能够取得优越成绩，主要得益于算法是在内部真实业务中进行实战验证，根据业务反馈的效果和bad cases进行持续优化与迭代。真实业务数据相对比赛数据的后处理攻击更加复杂，在真实AIGC音频业务数据上优化迭代后的算法在检测泛化性和鲁棒性上有明显的提升。

方案简介

测任务，团队基于开源模型自制作视频、内部业务数据，并结合开源数据集（如GenVideo等）构建了千万级别AIGC视频检测数据集，覆盖Open-sora、Wan2.2、HunyuanVideo、豆包(即梦)、千问、混元、可灵AI、Pika、SORA和Veo等国内外流行的AI生成视频模型或平台。

为了提升AIGC视频检测算法的性能，所采用的方案基于内部训练的AIGC图像检测模型进行扩展，具体而言，方案使用预训练的AIGC图像检测模型的主干网络作为特征提取器，并设计了一个多帧输入的时序特征融合模块得到最终的视频级别的分类结果。在开源数据集GenVideo的验证集中测试的准确率最高达到98.68%。同时，结合内部真实业务数据与反馈持续迭代优化，使模型在真实应用场景中具备更强的泛化能力与鲁棒性。

方案简介

围绕政策标准要求以及赛题规定，我们提出了《AIGC合规标识添加、提取与溯源实践方案》，该方案支持全场景AIGC合规标识添加、提取与溯源，具有高效率、低成本、安全可信的优点，方案具体内容如下：

方案构建了多层级AIGC标识添加、提取与溯源机制，涵盖标识提取与可信交叉验证、内容特征溯源和智能体溯源分析三个核心模块。

首先，方案建立了增强型标识体系，该体系在AIGC生成内容中添加显式、隐式、增强型显式、增强型隐式及内容隐式等不同维度的标识。这些标识共同构成结构化、高鲁棒性的元数据层，为后续的标识提取与可信交叉验证提供可靠依据。基于该体系，标识提取与可信交叉验证模块能够准确解析标识信息，并有效识别缺失、篡改、恶意移除等情况，确保溯源结果的真实性和可信度。

在实际应用中，显式标识定位准确率超99%，关键内容提取准确率超98%，为溯源任务提供了坚实的技术支撑；内容隐式标识提取技术具备高保真、高鲁棒性，能抵御百余种专业攻击，已通过了ChinaDRM、好莱坞等权威认证。

当检测到标识丢失、被篡改或恶意移除而无法作为有效溯源依据时，系统自动启用内容特征溯源模块，该模块通过分析AIGC生成内容的内在特征溯源其基座模型。在16种主流大模型的测试中，模型综合准确率超过96%，在云端环境下单次推理耗时约100毫秒。

最后，溯源分析智能体融合标识验证结果、内容特征溯源证据与领域专家知识，对来自不同模块的异构溯源信息进行协同推理，输出一致、可靠的综合溯源结论。

本方案支持全场景、多模态的AIGC标识添加、提取与溯源，覆盖文档、图像、音频、视频及虚拟交互内容，并支持网页、移动应用、直播流等多种常见多模态数字内容形式。通过“快速初筛 + 精准复核”的全自动分层检测策略，在保障高准确率的同时显著降低计算开销与运营成本。最终实现在复杂场景下更高的溯源成功率和更精准的溯源结果。

此外，我们积极响应我国《人工智能生成合成内容标识办法》和《网络安全技术人工智能生成合成内容标识方法》等政策标准要求，推动相关人工智能生成内容的检测技术研究及标准研制，牵头立项了ITU-T首个AI内容检测国际标准《AI生成内容检测指南》、国家标准TC260-PG-202512A《AI生成合成内容检测第1部分：框架》、国家标准GB/T 45909-2025《网络安全技术数字水印技术实现指南》、工信部行业标准《电信网和互联网人工智能生成媒体检测技术实现指南》等。我们首创“检测→水印→检验”闭环技术体系，覆盖AI生成内容从识别到标识再到合规验证的全流程，入选网络安全国家标准应用实践案例库。