KnowPhish: Large Language Models Meet Multimodal Knowledge Graphs for Enhancing Reference-Based Phishing Detection

简介

网络钓鱼攻击给个人和企业带来了巨大的损失，这促使人们开发强大高效的自动化网络钓鱼检测方法。基于参考的网络钓鱼检测器（RBPDs）是最先进的方法，它将目标网页上的标志与已知标志集进行比较。然而，现有RBPDs的一个主要限制是它们依赖于手动构建的品牌知识库，这使得它无法扩展到大量品牌，导致了由于知识库中品牌覆盖不足而产生的假阴性错误。为了解决这个问题，我们提出了一个自动化知识收集管道，使用它我们收集并发布了一个大规模的多模式品牌知识库KnowPhish，包含20k个品牌，每个品牌都有丰富的信息。KnowPhish可以以即插即用的方式用于提高现有RBPDs的性能。现有RBPDs的第二个限制是它们仅依赖于图像模态，忽略了网页HTML中存在的有用文本信息。为了利用这些文本信息，我们提出了一种基于大型语言模型（LLM）的方法，从文本中提取网页的品牌信息。我们的多模式网络钓鱼检测方法KnowPhish Detector（KPD）可以检测有或没有标志的网络钓鱼网页。我们在经过手动验证的数据集和新加坡本地环境的现场研究中评估了KnowPhish和KPD，与最先进的基线相比，显示出了显着的效果和效率改进。
图表
解决问题

该论文的问题是如何解决钓鱼攻击对个人和企业造成的重大损失，提出了一种自动化的钓鱼检测方法。
关键思路

论文的关键思路是使用一个自动化的知识收集流程，收集并发布一个大规模的多模态品牌知识库，以及使用基于大型语言模型的方法从文本中提取网页的品牌信息，从而构建多模态的钓鱼检测方法。
其它亮点

论文提出的KnowPhish和KPD方法在手动验证的数据集和新加坡本地环境的现场研究中都表现出了比现有基线方法更高效和有效的性能。此外，他们还开源了他们的知识库和代码。
相关研究

近期在这个领域的相关研究包括基于机器学习的钓鱼检测方法、基于深度学习的图像和文本检测方法等。

KnowPhish: Large Language Models Meet Multimodal Knowledge Graphs for Enhancing Reference-Based Phishing Detection

评论