简介:推荐系统应该回答 "如果向用户推荐一个项目,反馈会是什么"这一干预性问题,要求估计推荐对用户反馈的因果效应。一般来说,这需要阻断同时影响推荐和反馈的混杂因素的影响。为了处理混杂偏差,一种策略是将倾向性评分纳入模型学习。然而,基于倾向性评分的方法假设所有的混杂因素都观测到了,即不存在未测量的混杂因素(例如,用户的财务状况),这可能导致有偏的倾向性并损害推荐性能。为此,我们提出了Robust Deconfounder(RD),它考虑到了未测量的混杂因素对倾向性的影响,在较弱的假设下,这种影响是有界限的。它通过敏感性分析来估计边界,通过对抗性学习在边界内学习一个对未测量的混杂因素具有鲁棒性的推荐模型。然而,在一定范围内追求稳健性可能会限制模型的准确性。为了避免鲁棒性和准确性之间的权衡,我们进一步提出了基准RD(BRD),将预先训练好的模型纳入到学习中作为基准。理论分析证明,与现有的基于倾向性的去偏方法相比,我们的方法具有更强的鲁棒性,同时也证明了BRD的无害特性。我们的方法适用于任何基于倾向性的估计器,在三个真实世界的数据集上进行了实验,以证明我们的方法的有效性,包括IPS、Doubly Robust和AutoDebias。
论文地址:http://staff.ustc.edu.cn/~hexn/papers/kdd22-deconfound-rec.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢