简介:推荐系统的一般目的是为用户提供个性化的建议,而不是推荐热门的商品。然而,常规的训练范式,即拟合一个推荐修正模型来恢复丢失的用户行为数据,会使得模型偏向热门商品。这就导致了马太效应,使得热门商品更频繁地被推荐,甚至变得更受欢迎。现有的工作使用逆向倾向加权(IPW)来解决这个问题,它降低了热门商品对模型训练的影响,从而增加了位于长尾中的商品的影响。尽管理论上合理,但IPW方法对加权策略高度敏感,而这是出了名的难以调整。在这篇文章中,我们从因果这一根本性的角度探讨了推荐系统中的热度偏差问题(Popularity Bias)。我们发现热度偏差存在于商品对排名分数的直接影响中,即商品的内在属性是错误地赋予其较高排名分数的原因。为了消除热度偏差,我们有必要回答一个反事实的问题,即如果模型只使用商品属性,那么排名得分会是多少。为此,我们构建了一个因果图来描述推荐过程中重要的因果关系。在训练过程中,我们进行多任务学习;在测试期间,我们执行反事实推理以消除商品流行度的影响。值得注意的是,我们的解决方案修正了推荐的学习过程,这是一个广泛的模型,它可以很容易地在现有的方法中实现。我们在矩阵分解(MF)和LightGCN上进行了演示,这两个模型是协同过滤的传统模型和SOTA模型的代表。我们也在五个真实数据集上验证了方法的有效性。

链接:https://arxiv.org/pdf/2010.15363.pdf
推荐理由:本文从因果推断的角度描述了推荐系统中一些变量间的因果关系,并从反事实推理出发来解决Popularity Bias对于模型的影响。

内容中包含的图片若涉及版权问题,请及时与我们联系删除