KDD'21 | 双重图强化神经推荐模型

论文：Dual Graph enhanced Embedding Neural Network for CTR Prediction

下载地址：

https://arxiv.org/pdf/2106.00314.pdf

基于特征交互建模和基于用户兴趣挖掘的方法是两种最流行的方法，已被广泛探索多年，并在点击率预测方面取得了很大进展。然而，基于特征交互的方法严重依赖于不同特征的共现，可能会遇到特征稀疏问题；基于用户兴趣挖掘的方法，需要丰富的用户行为来获取用户的多样化兴趣，容易遇到行为稀疏问题。

为了解决这些问题，原文提出了一个新的模块命名为 Dual Graph Enhanced Embedding，以分治法(divide-and-conquer) 和课程学习(curriculum-learning) 的思路来改进 Embedding 的初始化以及表征学习，配合使用各种 CTR 预测模型来缓解这两个问题。

推荐系统中一条样本包括用户(u)、商品(v )、用户属性(A_u)、商品属性( B_v)、用户点击过的商品序列、背景信息 6个部分。

原文重点关注初始化和表征学习阶段的优化，原作者认为，在初始化阶段可以通过 user-user 和 item-item 的相似关系，对每个属性域中的属性特征进行调整，以减轻数据稀疏问题造成的影响。在表征学习阶段阶段，可以进一步利用图关系中 user-user, item-item, user-item 的联系，对用户特征和商品特征进行交叉，进而对用户特征，商品特征，和点击序列特征进行调整，流程如下图。

创新点

在图建模的过程中，将建模分阶段为属性图和协同过滤图两个阶段，同时对协同过滤图建模时以分治法和课程学习的思路来改进 Embedding 的初始化以及表征学习，多阶段逐步对 Graph embedding 进行优化。

点评

方法比较有意思，但是实际操作中仍有若干难点：比如配合CTR模型做 Online Learning 时，动态增加 user 和 item 时，图的更新代价很高，较难配合实时增量训练。

同时在实验的对比上有不公平之处：Graph 的增强实际上是一个预训练的过程，弥补了特征工程在建模中的缺失，同时所使用的总计算资源要远远高于对比基线，而对比的数据集是未经特征工程的数据，在经过一定程度特征工程的数据集上的效果未必一致。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

KDD'21 | 双重图强化神经推荐模型

评论列表

评论