LLMmap: Fingerprinting For Large Language Models

2024年07月22日
  • 简介
    我们介绍了一种名为LLMmap的指纹攻击,它是针对集成了LLM的应用程序的第一代攻击。LLMmap采用主动指纹识别方法,向应用程序发送精心制作的查询,并分析响应以识别使用的特定LLM模型。仅需8次交互,LLMmap就可以以超过95%的准确率准确识别LLM。更重要的是,LLMmap被设计成在不同的应用程序层上具有鲁棒性,使其能够识别在各种系统提示、随机采样超参数甚至是复杂的生成框架(如RAG或Chain-of-Thought)下运行的LLM。
  • 图表
  • 解决问题
    LLMmap试图通过主动指纹识别方法,识别LLM模型,解决LLM模型鲁棒性的问题。
  • 关键思路
    LLMmap利用主动指纹识别方法,发送查询并分析响应,准确识别LLM模型。
  • 其它亮点
    LLMmap能够在不同应用程序层面上识别LLM模型,具有较高的准确性和鲁棒性。实验结果表明,LLMmap可以在8次交互中识别出95%以上的LLM模型。
  • 相关研究
    与LLMmap相关的研究包括:基于机器学习的指纹识别、基于深度学习的指纹识别以及其他主动指纹识别方法的研究。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论