Deep Overlapping Community Search via Subspace Embedding

2024年04月23日
  • 简介
    本文介绍了社区搜索(CS)的应用,其目的是基于特定查询识别一组节点,利用结构上的凝聚性和属性上的同质性。这项任务的应用范围广泛,从欺诈检测到推荐系统均可使用。与基于算法的方法不同,基于图神经网络(GNN)的方法使用地面真实标签定义社区,利用先前的知识从图结构和节点特征中探索模式。然而,现有的解决方案面临三个主要限制:1)基于GNN的模型主要关注不相交的社区结构,忽略了属于多个社区的节点的特性。2)这些模型结构缺乏低阶意识和严重的效率问题。3)确定的社区受到搭便车和边界效应的影响。本文提出了简化的多跳注意力网络(SMN),由三个设计组成。首先,我们介绍了一种称为稀疏子空间滤波器(SSF)的子空间社区嵌入技术。SSF使社区嵌入的投影进入不同的向量子空间,适应了重叠和嵌套社区结构的特性。此外,我们提出了一种轻量级的模型结构和逐跳注意力机制,以捕获高阶模式,同时提高模型效率。此外,我们开发了两种搜索算法,以最小化潜在空间的社区半径,解决了搭便车和边界效应的挑战。据我们所知,这是第一篇关于重叠社区搜索的基于学习的研究。大量实验证实了SMN相对于现有最先进方法的卓越性能。SMN在F1-Score方面实现了14.73%的改进,并提高了模型效率达3个数量级。
  • 图表
  • 解决问题
    本论文旨在解决社区搜索中存在的三个主要问题:GNN模型主要关注不相交的社区结构,忽略了属于多个社区的节点的特性;现有模型结构缺乏低阶意识和严重的效率问题;社区的边界效应和自由骑手问题。
  • 关键思路
    SMN提出了三个设计,包括稀疏子空间过滤器(SSF)技术、轻量级模型结构和逐跳注意机制,以捕捉高阶模式并提高模型效率。此外,还开发了两种搜索算法来最小化潜在空间的社区半径,以解决自由骑手和边界效应的挑战。
  • 其它亮点
    该论文是第一篇学习重叠社区搜索的研究。实验结果表明,SMN相比现有的最先进方法,在F1-Score上提高了14.73%,并且模型效率提高了3个数量级。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如“Community Detection with Graph Neural Networks: A Survey”、“Overlapping Community Detection in Networks: The State of the Art and Comparative Study”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论