协同过滤是一种被广泛应用于推荐系统中的方法,其利用不同用户之间(或不同物品之间)的相似性关系来过滤和抽 取用户和物品的交互信息,从而进行用户推荐。近年来,图神经网络因其出色的表示学习性能和良好的可扩展性逐渐成为推荐 领域中的一种新兴的范式.文中从图学习角度对近年来推荐领域的研究进行系统性的回顾与总结。首先,根据数据类型将推 荐场景分成两类,包括基于交互信息的推荐系统(将用户与物品交互数据作为关键数据源)和辅助信息增强的推荐系统(融入与 用户和物品相关联的社交信息和知识图谱信息);其次,从随机游走、图表示学习和图神经网络方面入手,对不同推荐场景中的 方法、关键技术、主要难点和重要进展进行回顾与总结;最后,总结关于图学习方法在推荐领域中面临的挑战和未来的主要研究 方向。

论文链接

1 引言 

随着互联网技术的高速发展以及移动终端的全面普及, 互联网中的信息量呈指数级增长.互联网给用户提供海量资 源的同时,也给用户带来了信息过载的问题[1G2],即用户很难 在众多内容中快速、高效地筛选出自己感兴趣或者对自己有 意义的内容.推荐系统通过主动向用户推荐其感兴趣内容,帮助用户 过滤掉许多不感兴趣或者不相关的内容,从而有效地缓解信 息过载的问题,使用户能更加便捷地浏览感兴趣的内容.因 此,推荐系统被广泛地应用在许多企业的服务中,已逐渐成为 企业吸引用户不可或缺的工具.针对不同的应用场景,推荐 系统也演变出不同的推荐任务,其中包括线上购物推荐(如 Amazon、天猫),社交媒体推荐(如微博、抖音)等,为 人 们 的生活带来极大便利的同时,也极大地影响着其生活方式[1]。

传统推荐 系 统 分 为 3 类[3]:基 于 内 容 的 推 荐 (ContentG BasedRecommendation,CB)[4]、基于协同过滤的推荐(CollaG borativeFilteringRecommendation,CF)[5]和 混 合 推 荐 (HyG bridRecommendation).基于内容的推荐算法根据用户的历 史交互记录,构建与历史交互的物品关联性高的推荐物品集, 实现对目标用户的推荐任务;基于协同过滤的推荐利用不同 用户之间(不同物品之间)的相似性关系,对用户与物品的交 互信息(点击、购买、评分等交互行为)进行筛选过滤,为目标 用户推荐感兴趣的物品;混合推荐将不同推荐技术融入推荐 系统中,避免单一推荐技术的缺陷.传统推荐系统中,相似性 度量方法包括欧氏距离、余弦相似度、皮尔逊相关系数等.常 用的模型方法包括矩阵分解(MatrixFactorization,MF)[6]、概 率矩 阵 分 解 (Probabilistic MatrixFactorization,PMF)[7]等. 传统推荐系统简单易操作,可以快速地对用户与物品的交互 信息建模,但存在数据稀疏问题,无法处理关系复杂的推荐以 及缺乏可解释性。

随着机器学习的快速发展,经典的机器学习算法被广泛 地应用到推荐领域中,如逻辑回归(LogisticRegression,LR)、 梯度提升决策树(GradientBoostingDecisionTree,GBDT)和 因子分解机(Factorization Machines,FM)等[8G10].基于机器 学习的推荐模型可以处理运算复杂的推荐,但基于机器学习 的推荐算法往往只能建模用户的历史交互数据中的低阶特征 表示,缺乏对高阶特征表示的建模能力. 随着深度学习的兴起,深度神经网络被广泛地应用到推 荐 领 域 中,如 深 度 神 经 网 络 (Deep Neural Networks, DNN)[11G12]、卷积神经网络(ConvolutionalNeuralNetworks, CNN)[13G15]、循 环 神 经 网 络 (Recurrent Neural Network, RNN)[16]、注意力模型(Attention Model)[17]以及变分自编码 器(VariationalAutoencoder,VAE)[18G19]等,并且都取得了不 错的推荐效果。

推荐系统中的大部分数据本质上都可被视为图结构数 据.例如,用户对物品的交互行为(点击、浏览、购买等),从图 结构方面考虑,用户一旦点击或购买物品,就与这些物品相关 联.但绝大多数深度学习任务都是针对1D,2D或3D 的欧氏 结构化数据(如声音信号、图像和视频等)进行研究.推荐系 统中的非欧氏结构化数据(图结构数据)的节点的邻域并不一 致,部分节点的邻居节点多,部分节点的邻居节点少.非欧氏 结构化数据的复杂性使得传统的深度学习无法有效地建模图 结构数据[20].随着图学习(GraphLearning,GL)方法,特别 是图学习中的图神经网络(GraphNeuralNetworks,GNN)的 提出,其在复杂关系提取和链路预测等许多图任务中取得了 巨大成功[21G27],引起了学术界和工业界研究人员的关注.由 于推荐系统的大部分数据具有图结构的特性,将图学习方法 应用到推荐领域是一种很自然的做法.因此,图学习方法已 逐渐成为推荐领域内一种被广泛研究的新兴推荐范式,即基 于图学习的推荐系统[28G31].当用户与物品的交互信息和用 户与物品相关联的辅助信息被构建成图结构形式,再结合以 随机游走、图表示学习和图神经网络为主要代表的图学习方 法,即可捕获、学习和模拟用户与物品之间高阶的、复杂的关 系,更加有效地学习用户的长期兴趣偏好和物品的特征属性, 以提升推荐系统的推荐性能[32G36].因此,对基于图学习的推 荐方法进行系统性的总结与回顾,可以使研究者们更好地把 握这一新兴领域的研究现状和挑战,促进图学习方法在推荐 领域的发展。

由于图学习技术在推荐领域中的广泛运用,一部分研究 学者已经对基于图结构数据的推荐系统进行了回顾和总结. Laknath [29]从全局排名方法、重启随机游走到吸收随机游走3 个方面对不同推荐任务中的随机游走方法进行了详细的分析 与总结.Gao等[30]主要从推荐系统的冷启动、可扩展性、个 性化以及动态性的推荐问题出发,对基于知识图 谱(KnowG ledgeGraph,KG)推荐任务上的图神经网络方法进行了回顾 和总结.Guo等[28]将知识图谱任务上的推荐方法划分为嵌 入方法、路径方法以及未统一定义方法,然后分别对各分类中 的推荐方法进行了详细的分析与总结.Wu等[31]从图神经网 络角度对传统推荐、社交推荐和知识图谱推荐进行了总结. 然而,上述综述工作存在不足之处,Laknath [29]和 Wu等[31]的 综述工作仅对单一的推荐方法(前者是随机游走方法,后者是 图神经网络方法)进行了回顾,Laknath [29]的综述工作时间较 早,并没有总结近几年的相关推荐任务和方法.Gao等[30]和 Guo等[28]的综述工作仅对单一的推荐场景(知识图谱)进行 了总结.然而单一的推荐方法和推荐场景不能使研究学者快 速且全面地了解基于图结构的推荐场景的研究现状和挑战. 针对上述工作的不足,本文首先总结了推荐任务中常用的数 据集和评价指标,以方便研究者快速开展对推荐系统的研究; 其次,根据运用的推荐数据类型将推荐运用场景分成两组基于交互信息的推荐系统(仅利用用户与物品的交互数据)和辅 助信息增强的推荐系统(融入与用户和物品相关联的社交信 息以及知识图谱信息等信息).其中,辅助信息增强的推荐系 统主要从用户社交信息和物品知识图谱两个方面对用户和物 品相关联的辅助信息进行详细分析,从而对辅助信息增强的 推荐系统进行回顾与总结.针对不同的推荐运用场景,分别 对随机游走、图表示学习和图神经网络这3种图学习方法进 行总结,分析了不同的图学习方法在不同推荐场景下的难点 和研究现状.最后,本文总结了图学习方法在推荐领域的未 来研究方向,使研究者可以更加清晰地了解图学习在推荐领 域中的挑战和发展趋势.基于图学习的推荐方法的分类如 图1所示.

内容中包含的图片若涉及版权问题,请及时与我们联系删除