LGB: Language Model and Graph Neural Network-Driven Social Bot Detection

2024年06月13日
  • 简介
    恶意社交机器人通过传播虚假信息和煽动社交舆论来实现其恶意目的,严重危及社会安全,因此它们的检测成为一个重要问题。最近,基于图的机器人检测方法已经取得了最先进的性能。然而,我们的研究发现社交网络中存在许多孤立和链接不良的节点,如图1所示,这些节点是基于图的方法无法有效检测到的。为了解决这个问题,我们的研究集中于有效利用节点语义和网络结构共同检测稀疏链接的节点。鉴于语言模型在自然语言理解方面的出色表现,我们提出了一种新的社交机器人检测框架LGB,它由两个主要组件组成:语言模型(LM)和图神经网络(GNN)。具体而言,社交账户信息首先被提取成统一的用户文本序列,然后用于对语言模型进行监督微调,以提高其理解社交账户语义的能力。接下来,语义丰富的节点表示被输入到预训练的GNN中,通过聚合邻居的信息进一步增强节点表示。最后,LGB融合两种模态的信息,以提高稀疏链接节点的检测性能。对两个真实世界数据集的广泛实验表明,LGB始终比最先进的基线模型表现出高达10.95%的优越性。LGB已经上线:https://botdetection.aminer.cn/robotmain。
  • 图表
  • 解决问题
    本篇论文旨在解决社交媒体中恶意社交机器人检测中的问题,尤其是针对孤立和链接较差的节点的检测。
  • 关键思路
    该论文提出了一种新的社交机器人检测框架LGB,利用语言模型和图神经网络相结合的方法,通过对节点的语义和网络结构进行联合检测,从而提高了对稀疏链接节点的检测能力。
  • 其它亮点
    该论文的实验结果表明,LGB模型相比现有基准模型提高了最高达10.95%的性能表现。论文使用了两个真实世界的数据集进行实验,并且已经在网上开放了LGB模型的应用。
  • 相关研究
    在该领域中,最近的相关研究包括:'Detecting Automation of Twitter Accounts: Are CAPTCHAs Necessary?'和'Towards Detecting Social Bots on Twitter'。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论