Dual Test-time Training for Out-of-distribution Recommender System

2024年07月22日
  • 简介
    深度学习已经广泛应用于推荐系统中,并取得了近来的突破性进展。然而,大多数现有的基于学习的方法假定在训练阶段和测试阶段之间用户和物品的分布保持不变。然而,在现实世界中,用户和物品特征的分布可能会自然而然地发生变化,这可能会导致推荐性能的显著降低。这种现象可以被形式化为一个超出分布(Out-Of-Distribution,OOD)推荐问题。为了解决这个挑战,我们提出了一个新的双重测试时间训练框架来解决OOD推荐问题,称为DT3OR。在DT3OR中,我们在测试时间阶段引入了一个模型自适应机制,来仔细更新推荐模型,使模型能够特别适应于不断变化的用户和物品特征。具体来说,我们提出了一个自我蒸馏任务和一个对比任务,来帮助模型在测试时间阶段学习用户的不变兴趣偏好和变化的用户/物品特征,从而促进对变化特征的平滑适应。此外,我们提供了理论分析来支持我们的双重测试时间训练框架的基本原理。据我们所知,这篇论文是第一篇通过测试时间训练策略来解决OOD推荐问题的工作。我们在三个数据集上进行了实验,并使用了不同的主干网络。全面的实验结果表明,与其他最先进的基线相比,DT3OR的有效性得到了证明。
  • 图表
  • 解决问题
    本论文旨在解决推荐系统中的Out-Of-Distribution(OOD)问题,即用户和物品特征分布在训练和测试阶段可能会发生变化,导致推荐性能下降的问题。
  • 关键思路
    本文提出了一种名为DT3OR的Dual Test-Time-Training框架,通过在测试阶段引入模型自适应机制,更新推荐模型,适应变化的用户和物品特征。具体而言,作者提出了自蒸馏任务和对比任务,帮助模型学习用户的不变兴趣偏好和变化的用户/物品特征,以便平滑适应变化的特征。
  • 其它亮点
    本文的亮点包括:提出了一种新的框架DT3OR来解决OOD推荐问题;提出了自蒸馏任务和对比任务来帮助模型学习用户的兴趣偏好和变化的特征;通过实验验证了DT3OR的有效性,与其他基线模型进行了比较。
  • 相关研究
    在这个领域中,最近的相关研究包括:《Out-of-Distribution Recommender Systems: A Review of Recent Progress》、《Learning to Learn from Out-of-Distribution Experiences in Variational Autoencoders for Recommender Systems》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论