Evaluating Large Language Models' Capability to Launch Fully Automated Spear Phishing Campaigns: Validated on Human Subjects

2024年11月30日
  • 简介
    在本文中,我们评估了大型语言模型进行个性化网络钓鱼攻击的能力,并将其性能与人类专家和去年的人工智能模型进行了比较。我们包括了四个电子邮件组,共有101名参与者:一个对照组,收到随机生成的网络钓鱼邮件,点击率(收件人点击了邮件中的链接)为12%;由人类专家生成的邮件(点击率为54%);完全由AI自动生成的邮件(点击率为54%);以及利用人在回路的AI邮件(点击率为56%)。因此,AI自动生成的攻击与人类专家的表现相当,比对照组高出350%。这些结果比去年类似研究的结果有了显著的改进,突显了人工智能模型欺骗能力的增强。我们的AI自动生成的邮件使用了一个定制工具,该工具自动化了整个鱼叉式网络钓鱼过程,包括信息收集和为每个目标创建个性化的漏洞档案。AI收集的信息在88%的情况下是准确且有用的,只有4%的参与者收到了不准确的档案。我们还使用语言模型来检测邮件的意图。Claude 3.5 Sonnet 的得分超过90%,误报率低,并检测出了一些看似无害但通过了人工检测的邮件。最后,我们分析了网络钓鱼的经济性,强调了AI如何使攻击者能够以更低的成本针对更多个人,并将盈利能力提高多达50倍,特别是在较大的受众群体中。
  • 图表
  • 解决问题
    该论文旨在评估大型语言模型在执行个性化网络钓鱼攻击方面的能力,并将其与人类专家和去年的AI模型进行比较。这是一个关于AI在网络安全领域应用的新问题,特别是关注其欺骗性的增强。
  • 关键思路
    论文的关键思路是利用大型语言模型自动生成个性化的网络钓鱼邮件,并通过自动化工具完成整个攻击过程,包括信息收集和创建目标的漏洞档案。这种方法不仅提高了攻击的成功率,还显著降低了成本。相比现有研究,该方法展示了AI在复杂任务中的进步。
  • 其它亮点
    论文通过四个不同的邮件组进行了实验,包括控制组、人类专家生成的邮件、完全AI自动生成的邮件和人机协作生成的邮件。结果显示,AI自动生成的邮件点击率与人类专家相当,且远高于控制组。此外,论文还探讨了AI在检测恶意邮件方面的表现,Claude 3.5 Sonnet在检测意图方面表现优异。最后,论文分析了AI如何通过降低攻击成本来提高网络钓鱼的经济回报。
  • 相关研究
    近期在这个领域的一些相关研究包括: 1. "Evaluating the Efficacy of AI in Social Engineering Attacks" - 探讨了AI在社会工程学攻击中的有效性。 2. "Automated Phishing Email Generation Using Deep Learning Techniques" - 研究了深度学习技术在自动生成网络钓鱼邮件中的应用。 3. "Detecting Phishing Emails with Advanced Machine Learning Models" - 专注于使用先进的机器学习模型检测网络钓鱼邮件。 4. "The Economic Impact of AI on Cybersecurity Threats" - 分析了AI对网络安全威胁的经济影响。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论