- 简介图聚类是图挖掘中一项基本且具有挑战性的任务,旨在将图中的节点分类为几个不相交的簇。近年来,基于图对比学习(GCL)的方法已成为图聚类领域的主流研究方向,并推动了新的最先进技术。然而,基于GCL的方法严重依赖于图扩充和对比方案,这可能会引入挑战,如语义漂移和可扩展性问题。另一种有前途的研究方向涉及采用模块度最大化作为聚类任务的指导原则,这是一种流行且有效的社区检测度量。尽管最近取得了进展,但模块度最大化的基本机制仍不为人们所了解。在这项工作中,我们深入探讨了模块度最大化在图聚类中的成功原因。我们的分析揭示了模块度最大化和图对比学习之间的强连接,其中正例和反例是由模块度自然定义的。基于我们的结果,我们提出了一种称为MAGI的社区感知图聚类框架,它利用模块度最大化作为对比预文本任务,以有效地揭示图中社区的潜在信息,同时避免了语义漂移的问题。在多个图数据集上的大量实验验证了MAGI相对于最先进的图聚类方法在可扩展性和聚类性能方面的有效性。值得注意的是,MAGI可以轻松地扩展到具有1亿个节点的大型图,同时优于强基线。
- 图表
- 解决问题解决问题:论文旨在探讨并解决图聚类中的问题,特别是在使用图对比学习时可能出现的挑战,如语义漂移和可扩展性问题。同时,研究人员还试图深入了解模块度最大化在聚类任务中的潜在机制。
- 关键思路关键思路:论文提出了一个名为MAGI的社区感知图聚类框架,该框架利用模块度最大化作为对比预文本任务,以有效地揭示图中社区的基本信息,同时避免语义漂移问题。研究人员发现,模块度最大化与图对比学习之间存在强烈的联系,其中正负例自然地由模块度定义。
- 其它亮点亮点:MAGI框架在多个图数据集上进行了广泛的实验,验证了其在可扩展性和聚类性能方面相对于现有的图聚类方法的有效性。值得关注的是,MAGI可以轻松地扩展到具有1亿个节点的大型图,并且在性能上胜过强基线。该论文还提供了开源代码。
- 相关研究:最近的相关研究包括使用图对比学习的方法,以及使用模块度最大化作为聚类任务的指导原则的方法。其中,一些相关论文包括Graph Contrastive Learning with Augmentations和Modularity-Based Graph Clustering.
沙发等你来抢
去评论
评论
沙发等你来抢