Generative AI Misuse: A Taxonomy of Tactics and Insights from Real-World Data

简介

生成式、多模态人工智能（GenAI）在各行各业都具有变革潜力，但其滥用也带来了重大风险。先前的研究揭示了先进人工智能系统被恶意利用的潜力，但我们仍然缺乏具体了解GenAI模型在实践中如何被滥用或滥用的具体理解，包括用于造成伤害的策略。本文提出了一种GenAI滥用策略分类法，该分类法基于现有学术文献和对2023年1月至2024年3月期间约200起滥用事件的定性分析。通过这种分析，我们揭示了在此期间滥用的关键和新的模式，包括潜在动机、策略以及攻击者如何在图像、文本、音频、视频等多种模态中利用和滥用系统能力。
图表
解决问题

本论文旨在提出一种基于分类的方法，用于在多个模态（例如图像、文本、音频、视频）的情况下对不同类型的GenAI滥用策略进行分类，并阐明滥用策略的关键模式。
关键思路

本论文提出了一种分类方法来识别GenAI滥用策略，并通过对大量滥用事件的分析来揭示滥用策略的关键模式。
其它亮点

本论文通过分析大量滥用事件，提出了一种分类方法来识别GenAI滥用策略，并揭示了滥用策略的关键模式。论文还介绍了一些滥用策略的新颖案例和可能的动机。实验使用了多个数据集，并在多个模态上评估了分类方法的有效性。论文还提出了一些未来工作的方向。
相关研究

最近在这个领域中，还有一些相关的研究，例如“Exploring the Risks of Transfer Learning in GenAI”，“Adversarial Attacks on GenAI-based Image Classification: A Survey”，“GenAI Security: Challenges and Opportunities”。

Generative AI Misuse: A Taxonomy of Tactics and Insights from Real-World Data

评论