Intruding with Words: Towards Understanding Graph Injection Attacks at the Text Level

2024年05月26日
  • 简介
    图神经网络在各种应用中表现出色,但仍然容易受到对抗攻击,特别是图注入攻击(GIAs),这种攻击会将恶意节点注入到原始图中,构成现实威胁。文本属性图(TAGs)由于在现实世界的应用中广泛存在,因此至关重要,并且通常用于评估这些漏洞。然而,现有研究仅关注于嵌入级别的GIAs,这种攻击注入的是节点嵌入而不是实际的文本内容,限制了它们的适用性并简化了检测。在本文中,我们首次探索了文本级别的GIAs,提出了三种注入文本内容到图中的新型攻击设计。通过理论和实证分析,我们证明了文本可解释性在攻击强度中起着至关重要的作用,这是之前在嵌入级别被忽视的因素。在我们研究的设计中,基于词频的文本级GIAs(WTGIA)因其在性能和可解释性之间的平衡而特别引人注目。尽管WTGIA取得了成功,但我们发现防御者可以轻松地通过定制的文本嵌入方法或基于大型语言模型(LLM)的预测器来增强其防御能力。这些见解强调了进一步研究文本级别GIAs的潜力和实际意义的必要性。
  • 图表
  • 解决问题
    本论文旨在探索针对文本属性图中的节点注入攻击(Graph Injection Attacks, GIAs),并比较不同攻击设计的性能和可解释性。现有的研究只集中在注入节点嵌入而不是实际文本内容的嵌入级别GIAs,限制了它们的适用性和检测难度。
  • 关键思路
    本论文首次探索文本级别的GIAs,并提出了三种新的攻击设计。通过理论和实证分析,论文发现文本可解释性在攻击强度方面发挥着关键作用。其中,基于词频的文本级别GIA(WTGIA)在性能和可解释性之间达到了平衡。
  • 其它亮点
    论文通过实验验证了不同攻击设计的性能和可解释性。同时,发现防御者可以通过自定义文本嵌入方法或大型语言模型(LLM)来增强防御能力。这些发现强调了进一步研究文本级别GIAs的必要性和实际意义。
  • 相关研究
    最近的相关研究包括:'Adversarial Attacks on Graph Neural Networks via Meta Learning','Targeted Adversarial Attacks on Node Embeddings via Structured Perturbations','Adversarial Attacks on Node Embeddings via Graph Poisoning'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论