论文链接:

https://arxiv.org/abs/2112.01035

code:

https://github.com/PaddlePaddle/PGL/tree/main/apps/Graph4Rec

目前主流的基于图神经网络的推荐系统由于在实验数据集以及评估指标上存在较大差异,导致不能直接进行比较。为此,本文构建了一个基于Paddle的工具包Graph4Rec。

它将训练图神经网络模型的范式统一为以下几个部分:图输入、随机游走生成、自我图生成、节点对生成和图神经网络选择。通过构建的这个pipeline,可以进行一些配置很容易地搭建自己的GNN模型。另外,他们开发了一个大规模的图引擎和一个参数服务器来支持分布式GNN训练。

并进行了系统和全面的实验,比较了不同GNN模型在不同场景和不同规模下的性能。大量的实验证明了gnn的关键组成部分的有效性。然后他们还试图弄清楚稀疏和稠密参数对gnn模型的性能影响。

最后,本文还研究了包括负抽样、自我图构造顺序和暖启动策略在内的方法,以寻找更有效和高效的gnn策略在推荐系统中的实践。

本文的整体架构图如上图所示,其将Graph4Rec项目统一成了以下5个部分进行图神经网络的训练,具体包括图输入、随机游走生成、自我图生成、节点对生成以及图神经网络选择等组件。

内容中包含的图片若涉及版权问题,请及时与我们联系删除