DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback loops

2023年11月10日
  • 简介
    推荐系统中训练的基于用户反馈的推荐模型通常存在偏差。用户反馈受到暴露机制的显著影响,因为用户只对暴露给他们的物品提供反馈,而被动地忽略未暴露的物品,从而产生大量的假阴性样本。这样的用户反馈不可避免地导致新模型继承偏差,并通过反馈循环放大偏差。此外,假阴性样本的存在使得负采样变得困难,并在模型的用户偏好建模过程中引入虚假信息。最近的研究调查了反馈循环和未知暴露机制对推荐质量和用户体验的负面影响,本质上将它们视为独立因素,并忽略了它们的交叉影响。为了解决这些问题,我们从数据迭代和反馈循环的角度深入分析了数据暴露机制,采用缺失非随机(MNAR)假设,在反馈循环下理论上证明了存在一种可用的稳定因子来转化暴露机制。我们进一步提出了动态个性化排名(DPR)算法,它使用动态重新加权来减轻暴露机制和反馈循环的交叉影响,无需额外信息。此外,我们设计了一个名为通用反假阴性(UFN)的插件,以减轻假阴性问题的负面影响。我们理论上证明了我们的方法减轻了反馈循环和未知暴露机制的负面影响。实验结果表明,使用DPR的模型可以更好地处理偏差积累和UFN在主流损失方法中的通用性。
  • 图表
  • 解决问题
    解决推荐系统中用户反馈偏差的问题,特别是由于曝光机制和反馈循环导致的偏差累积问题。
  • 关键思路
    提出了一种动态个性化排序算法(DPR),使用动态加权来减轻曝光机制和反馈循环的交叉影响,同时设计了一种插件(UFN)来缓解假负样本问题。
  • 其它亮点
    论文从数据迭代和反馈循环的角度深入分析了数据曝光机制,理论上证明了在反馈循环下曝光机制转换中存在一个可用的稳定因子。实验结果表明,使用DPR的模型可以更好地处理偏差积累问题,并且UFN插件在主流损失方法中具有普适性。
  • 相关研究
    相关论文:1. 'Bias and Debias in Recommender System: A Survey and Future Directions' by Li Chen and Pearl Pu, published by ACM Transactions on Interactive Intelligent Systems. 2. 'Recommender Systems' by Jie Shao and Xiaoming Li, published by Springer.
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论