ACM Computing Surveys (CSUR) 中文全称为美国计算机学会计算概观,是计算机学科最具影响力的期刊之一。作为计算机科学、理论和方法的综述类顶刊,其 2020 影响因子 10.282,该期刊主要发表计算机科学领域较有代表性的综述论文。PKU-DAIR 实验室研究成果 Graph Neural Networks in Recommender Systems: A Survey 已被 ACM Computing Surveys 接收。

近几年,图神经网络(GNN)技术在推荐系统中得到了广泛的应用,因为推荐系统中的大部分信息本质上都具有图结构,而 GNN 在图表示学习方面具有优势。该综述旨在梳理、总结并讨论关于基于 GNN 的推荐系统的研究工作,便于对此领域感兴趣的研究者或者工业界人士快速了解这一领域。具体来说,该综述基于推荐过程中使用的信息类型和推荐任务对现有工作进行分类。此外,我们分析了将 GNN 应用于不同类型数据和推荐任务面临的挑战,总结了现有工作如何应对这些挑战,并讨论了现有工作的优点和局限性。此外,我们阐述了 9 个该领域有待进一步研究的方向。

论文标题:

Graph Neural Networks in Recommender Systems: A Survey

论文链接:https://dl.acm.org/doi/abs/10.1145/3535101

综述提及的代表性工作及其开源实现:

https://github.com/PKU-DAIR/GNN-in-RS

 

引言

随着在线信息的爆炸式增长,推荐系统在缓解这种信息过载方面发挥着关键作用。由于推荐系统的重要应用价值,该领域一直有新兴的工作。在推荐系统中,主要挑战是从交互和辅助信息(如果有的话)中学习有效的用户/项目表示。最近,图神经网络(GNN)技术在推荐系统中得到了广泛的应用,主要原因有以下三点:1)推荐系统中的大部分信息本质上都具有图结构,而 GNN 在图表示学习方面具有优势;2)从图结构的角度,不同的数据类型信息可以采用统一的框架建模;3)GNN 通过多层网络传递信息,可以显式地编码用户交互行为中的高阶信号。本文基于推荐过程中使用的信息类型和推荐任务对现有工作进行分类,分别为用户-项目协同过滤,序列推荐,基于社交网络的推荐,基于知识图谱的推荐,以及其他任务。对于每个类别,我们总结了主要挑战,介绍了代表性模型并说明了它们如何解决这些问题。每一章的最后对现有工作的优点和局限性展开了讨论。本文总结了主流基准数据集、广泛采用的评估指标,并简述了实际应用。此外,我们阐述了 9 个该领域有待进一步研究的方向。

 

User-item Collaborative Filtering

给定 user-item 交互数据,user-item collaborative filtering 的目标是利用 items 来加强 user representations、利用 users 来加强 item representation。下图演示了如何使用 GNN 做 Collaborative Filtering。

目前工作集中于解决以下四个问题。

2.1 Graph Construction

使用异构的 user-item bipartite graph 还是使用两阶(two-hop)邻的同质图?考虑到效率,如何采样邻居?最直接的方法是直接使用原始的用户-项目二分图。如果某些节点在原始图中的邻居很少,则通过添加边或节点来丰富图结构将是有益的。在处理大规模图时,需要对邻域进行采样以提高计算效率。抽样是有效性和效率之间的权衡,更有效的抽样策略值得进一步研究。

2.2 Neighbor Aggregation

如何从邻居汇聚信息?是否区分邻居的重要程度?当邻居更加异质时,采用注意力机制对邻居进行聚合比相等的权重和程度归一化更可取;否则,后两者更易于计算。显式建模邻居之间的影响或中心节点与邻居之间的亲和力可能会带来额外的好处,但需要在更多数据集上进行验证。

2.3 Information Update

为更新节点,如何整合中心节点的当前表征和聚合邻居节点得到的表征?与丢弃原始节点相比,使用其原始表示和聚合的邻居表示更新节点会更可取。最近的工作表明,通过去除变换和非线性操作来简化传统的 GCN,可以获得比原始 GCN 更好的性能。

2.4 Final Node Representation

使用最后一层特征还是合并所有层?为了获得整体的用户/项目表示,利用所有层的表示比直接使用最后一层表示更可取。在整合来自所有层的表示的功能方面,线性加权且权重可学习的方式允许更大的灵活性,而拼接操作则保留了来自所有层的信息。

内容中包含的图片若涉及版权问题,请及时与我们联系删除