中国数据挖掘会议（China Conference on Data Mining，CCDM）是由中国计算机学会和中国人工智能学会主办，中国计算机学会人工智能与模式识别专业委员会和中国人工智能学会机器学习专业委员会协办的数据挖掘领域盛会。今年大会特设以下官方赛。

随着多模态大语言模型的快速发展和广泛应用，其强大的理解与生成能力备受学界和业界瞩目。然而，这些模型在安全性和鲁棒性方面的潜在风险引发了广泛关切。

为了探索多模态大语言模型的潜在安全风险和脆弱性，清华大学人工智能研究院联合阿里安全发起本次挑战赛。旨在邀请参赛者扮演“红队”角色，通过提交精心设计的图像文本对，试图触发模型产生有害、不当甚至非法的内容，用以评估并揭示这些模型在安全防护方面的潜在缺陷。

此过程不仅有助于全面评估多模态大语言模型的安全性能，还将推动对这些模型安全隐患的认知，促进技术的安全、可控与可信发展，从而提升学术界与业界对多模态大模型安全风险的关注，进而形成有效的应对策略。

🌟竞赛主办方

中国计算机学会人工智能与模式识别专业委员会

中国人工智能学会机器学习专业委员会

清华大学人工智能研究院

安徽省安全人工智能研究院

阿里安全

🌟竞赛参与者要求

1. 各培养单位正式注册教师、在读研究生以及博士生

2. 国内各研究团体、企事业单位

🌟参赛方式

以个人或团队方式均可通过邮件方式报名参赛，每个参赛队伍人员不超过5人，每名参赛选手只能参加1个参赛队。每个参赛队伍每天最多可更新2次结果，截止时间之后不能再更新结果。

拟采用的组织方式为主办方提供要求，参赛队提交测试数据。由主办方利用已有的多模态大模型，通过验证运行可执行程序的输出结果，评出名次。

提交数量

比赛分为初赛和复赛两个阶段。在初赛阶段，参赛者需提交600个图像文本对，用以评测多模态大模型的安全性。其中每个图文对包含一张图像以及一段不超过50个单词的英文文本。所提交的图文对要求能诱导指定的4个开源多模态大模型产生潜在的安全风险输出。为了支撑评估过程，主办方将公开其中2个多模态大模型，供参赛者测试其提交内容。

初赛排名前15的队伍将会进入复赛，复赛阶段提交的图文对的数量为1200个。主办方将使用参赛者提交的数据对6个指定的大模型进行测试，包括初赛提供的两个公开模型，两个新加入的开源模型（非公开），以及两个商用闭源模型，即GPT4-V与Gemini。值得注意的是，由于商用模型配备图像输入过滤器，参赛者在生成提交内容时应考虑其合规性，避免极端或恶意的内容数据直接被过滤器过滤。

在制作图文对的过程中，鼓励参赛者使用优化学习算法进行自动生成，以探索多模态大语言模型的安全边界。参赛者可以考虑以下方法：

1）基于梯度优化的对抗样本策略：使用基于梯度的对抗优化算法，在输入图像上添加精心设计的扰动，使得扰动后的图像能够欺骗多模态模型，产生有害或不当的输出。

2）基于生成模型的图像自动生成策略：利用Stable Diffusion、DALL-E等图像生成模型，结合文本提示自动生成多样化的对抗图像，并筛选出能有效触发目标风险的图文对。

3）其他新型对抗生成方法：鼓励参赛者设计新颖的对抗攻击方法，如利用语义导向的图像编辑等技术生成对抗样本。值得注意的是，所有方法必须确保合法性和符合伦理标准。

任务设置

在初赛阶段，参赛者针对以下6个安全风险类别各提交100个图像文本对；在复赛阶段，参赛者针对6个安全风险类别各提交200个图像文本对。