D2K: Turning Historical Data into Retrievable Knowledge for Recommender Systems

2024年01月21日
  • 简介
    在当今大型推荐平台上,大量的用户行为数据不断积累,记录了用户的各种兴趣和喜好。对于推荐系统来说,保存旧数据的知识并在新数据不断到来时使用这些知识是一个重要的问题。现有方法通常试图在模型参数中隐式保存知识。然而,这种以参数为中心的方法缺乏可扩展性和灵活性——容量难以扩展,知识难以利用。因此,在这项工作中,我们提出了一个将海量用户行为数据转化为可检索知识的框架(D2K)。这是一种以数据为中心的方法,与模型无关且易于扩展。不同于仅存储用户侧或物品侧信息等一元知识,D2K提出存储三元知识用于推荐,该知识由完整的推荐因素——用户、物品和上下文决定。目标样本检索的知识可直接用于增强任何推荐算法的性能。具体而言,我们引入了一个基于Transformer的知识编码器,以将旧数据转化为带有用户-物品-上下文交叉特征的知识。设计了个性化知识适应单元,通过将检索到的知识适应到目标样本中,有效地利用了知识库中的信息。在两个公共数据集上进行的大量实验表明,D2K显著优于现有基线,并与主要的推荐算法兼容。
  • 图表
  • 解决问题
    D2K框架旨在解决推荐系统中保存旧数据知识的问题,提高推荐算法的性能。
  • 关键思路
    D2K框架采用数据中心方法存储三元知识(用户、物品和上下文),并使用Transformer-based知识编码器和个性化知识适应单元来有效地利用知识库提高推荐性能。
  • 其它亮点
    论文通过两个公共数据集的实验表明,D2K显著优于现有的基线,并且与大量推荐算法兼容。
  • 相关研究
    最近在推荐系统领域的相关研究包括《Neural Collaborative Filtering》、《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论