「图学习推荐系统」最新2022综述

协同过滤是一种被广泛应用于推荐系统中的方法,其利用不同用户之间(或不同物品之间)的相似性关系来过滤和抽取用户和物品的交互信息,从而进行用户推荐。近年来,图神经网络因其出色的表示学习性能和良好的可扩展性逐渐成为推荐领域中的一种新兴的范式.文中从图学习角度对近年来推荐领域的研究进行系统性的回顾与总结。首先,根据数据类型将推荐场景分成两类,包括基于交互信息的推荐系统(将用户与物品交互数据作为关键数据源)和辅助信息增强的推荐系统(融入与用户和物品相关联的社交信息和知识图谱信息);其次,从随机游走、图表示学习和图神经网络方面入手,对不同推荐场景中的方法、关键技术、主要难点和重要进展进行回顾与总结;最后,总结关于图学习方法在推荐领域中面临的挑战和未来的主要研究方向。

论文链接

１引言

随着互联网技术的高速发展以及移动终端的全面普及, 互联网中的信息量呈指数级增长.互联网给用户提供海量资源的同时,也给用户带来了信息过载的问题[１Ｇ２],即用户很难在众多内容中快速、高效地筛选出自己感兴趣或者对自己有意义的内容.推荐系统通过主动向用户推荐其感兴趣内容,帮助用户过滤掉许多不感兴趣或者不相关的内容,从而有效地缓解信息过载的问题,使用户能更加便捷地浏览感兴趣的内容.因此,推荐系统被广泛地应用在许多企业的服务中,已逐渐成为企业吸引用户不可或缺的工具.针对不同的应用场景,推荐系统也演变出不同的推荐任务,其中包括线上购物推荐(如 Amazon、天猫),社交媒体推荐(如微博、抖音)等,为人们的生活带来极大便利的同时,也极大地影响着其生活方式[１]。

传统推荐系统分为３类[３]:基于内容的推荐 (ContentＧ BasedRecommendation,CB)[４]、基于协同过滤的推荐(CollaＧ borativeFilteringRecommendation,CF)[５]和混合推荐 (HyＧ bridRecommendation).基于内容的推荐算法根据用户的历史交互记录,构建与历史交互的物品关联性高的推荐物品集, 实现对目标用户的推荐任务;基于协同过滤的推荐利用不同用户之间(不同物品之间)的相似性关系,对用户与物品的交互信息(点击、购买、评分等交互行为)进行筛选过滤,为目标用户推荐感兴趣的物品;混合推荐将不同推荐技术融入推荐系统中,避免单一推荐技术的缺陷.传统推荐系统中,相似性度量方法包括欧氏距离、余弦相似度、皮尔逊相关系数等.常用的模型方法包括矩阵分解(MatrixFactorization,MF)[６]、概率矩阵分解 (Probabilistic MatrixFactorization,PMF)[７]等. 传统推荐系统简单易操作,可以快速地对用户与物品的交互信息建模,但存在数据稀疏问题,无法处理关系复杂的推荐以及缺乏可解释性。

随着机器学习的快速发展,经典的机器学习算法被广泛地应用到推荐领域中,如逻辑回归(LogisticRegression,LR)、梯度提升决策树(GradientBoostingDecisionTree,GBDT)和因子分解机(Factorization Machines,FM)等[８Ｇ１０].基于机器学习的推荐模型可以处理运算复杂的推荐,但基于机器学习的推荐算法往往只能建模用户的历史交互数据中的低阶特征表示,缺乏对高阶特征表示的建模能力. 随着深度学习的兴起,深度神经网络被广泛地应用到推荐领域中,如深度神经网络 (Deep Neural Networks, DNN)[１１Ｇ１２]、卷积神经网络(ConvolutionalNeuralNetworks, CNN)[１３Ｇ１５]、循环神经网络 (Recurrent Neural Network, RNN)[１６]、注意力模型(Attention Model)[１７]以及变分自编码器(VariationalAutoencoder,VAE)[１８Ｇ１９]等,并且都取得了不错的推荐效果。

推荐系统中的大部分数据本质上都可被视为图结构数据.例如,用户对物品的交互行为(点击、浏览、购买等),从图结构方面考虑,用户一旦点击或购买物品,就与这些物品相关联.但绝大多数深度学习任务都是针对１D,２D或３D 的欧氏结构化数据(如声音信号、图像和视频等)进行研究.推荐系统中的非欧氏结构化数据(图结构数据)的节点的邻域并不一致,部分节点的邻居节点多,部分节点的邻居节点少.非欧氏结构化数据的复杂性使得传统的深度学习无法有效地建模图结构数据[２０].随着图学习(GraphLearning,GL)方法,特别是图学习中的图神经网络(GraphNeuralNetworks,GNN)的提出,其在复杂关系提取和链路预测等许多图任务中取得了巨大成功[２１Ｇ２７],引起了学术界和工业界研究人员的关注.由于推荐系统的大部分数据具有图结构的特性,将图学习方法应用到推荐领域是一种很自然的做法.因此,图学习方法已逐渐成为推荐领域内一种被广泛研究的新兴推荐范式,即基于图学习的推荐系统[２８Ｇ３１].当用户与物品的交互信息和用户与物品相关联的辅助信息被构建成图结构形式,再结合以随机游走、图表示学习和图神经网络为主要代表的图学习方法,即可捕获、学习和模拟用户与物品之间高阶的、复杂的关系,更加有效地学习用户的长期兴趣偏好和物品的特征属性, 以提升推荐系统的推荐性能[３２Ｇ３６].因此,对基于图学习的推荐方法进行系统性的总结与回顾,可以使研究者们更好地把握这一新兴领域的研究现状和挑战,促进图学习方法在推荐领域的发展。

由于图学习技术在推荐领域中的广泛运用,一部分研究学者已经对基于图结构数据的推荐系统进行了回顾和总结. Laknath [２９]从全局排名方法、重启随机游走到吸收随机游走３个方面对不同推荐任务中的随机游走方法进行了详细的分析与总结.Gao等[３０]主要从推荐系统的冷启动、可扩展性、个性化以及动态性的推荐问题出发,对基于知识图谱(KnowＧ ledgeGraph,KG)推荐任务上的图神经网络方法进行了回顾和总结.Guo等[２８]将知识图谱任务上的推荐方法划分为嵌入方法、路径方法以及未统一定义方法,然后分别对各分类中的推荐方法进行了详细的分析与总结.Wu等[３１]从图神经网络角度对传统推荐、社交推荐和知识图谱推荐进行了总结. 然而,上述综述工作存在不足之处,Laknath [２９]和 Wu等[３１]的综述工作仅对单一的推荐方法(前者是随机游走方法,后者是图神经网络方法)进行了回顾,Laknath [２９]的综述工作时间较早,并没有总结近几年的相关推荐任务和方法.Gao等[３０]和 Guo等[２８]的综述工作仅对单一的推荐场景(知识图谱)进行了总结.然而单一的推荐方法和推荐场景不能使研究学者快速且全面地了解基于图结构的推荐场景的研究现状和挑战. 针对上述工作的不足,本文首先总结了推荐任务中常用的数据集和评价指标,以方便研究者快速开展对推荐系统的研究; 其次,根据运用的推荐数据类型将推荐运用场景分成两组: 基于交互信息的推荐系统(仅利用用户与物品的交互数据)和辅助信息增强的推荐系统(融入与用户和物品相关联的社交信息以及知识图谱信息等信息).其中,辅助信息增强的推荐系统主要从用户社交信息和物品知识图谱两个方面对用户和物品相关联的辅助信息进行详细分析,从而对辅助信息增强的推荐系统进行回顾与总结.针对不同的推荐运用场景,分别对随机游走、图表示学习和图神经网络这３种图学习方法进行总结,分析了不同的图学习方法在不同推荐场景下的难点和研究现状.最后,本文总结了图学习方法在推荐领域的未来研究方向,使研究者可以更加清晰地了解图学习在推荐领域中的挑战和发展趋势.基于图学习的推荐方法的分类如图１所示.

内容中包含的图片若涉及版权问题，请及时与我们联系删除

「图学习推荐系统」最新2022综述

评论