每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback loops
Hangtong Xu,
Yuanbo Xu,
Yongjian Yang
2023年11月10日
推荐系统中训练的基于用户反馈的推荐模型通常存在偏差。用户反馈受到暴露机制的显著影响,因为用户只对暴露给他们的物品提供反馈,而被动地忽略未暴露的物品,从而产生大量的假阴性样本。这样的用户反馈不可避免地导致新模型继承偏差,并通过反馈循环放大偏差。此外,假阴性样本的存在使得负采样变得困难,并在模型的用户偏好建模过程中引入虚假信息。最近的研究调查了反馈循环和未知暴露机制对推荐质量和用户体验的负面影响,本质上将它们视为独立因素,并忽略了它们的交叉影响。为了解决这些问题,我们从数据迭代和反馈循环的角度深入分析了数据暴露机制,采用缺失非随机(MNAR)假设,在反馈循环下理论上证明了存在一种可用的稳定因子来转化暴露机制。我们进一步提出了动态个性化排名(DPR)算法,它使用动态重新加权来减轻暴露机制和反馈循环的交叉影响,无需额外信息。此外,我们设计了一个名为通用反假阴性(UFN)的插件,以减轻假阴性问题的负面影响。我们理论上证明了我们的方法减轻了反馈循环和未知暴露机制的负面影响。实验结果表明,使用DPR的模型可以更好地处理偏差积累和UFN在主流损失方法中的通用性。
IR
AI
PDF
解读