简介:深度候选生成(DCG)通过表示学习将相关项目的收集范围从数十亿项缩小到数百项,在工业推荐系统中已经得到了非常普遍的应用。标准方法通过抽样近似最大似然估计(MLE),以更好的可扩展性,并以类似于语言建模的方式解决DCG问题。然而,实时推荐系统面临严重的暴露偏差,其词汇量比自然语言的词汇量大几个数量级,这意味着为了更好的拟合观测数据,MLE将保持甚至加剧暴露偏差。在本文中,我们从理论上证明了一种流行的选择对比损失等效于通过逆倾向加权来减少暴露偏差,这为理解对比学习的有效性提供了一个新的视角。基于这一理论发现,我们设计了一种对比学习方法——CLRec,用于在候选集规模非常大的推荐系统中提高DCG的公平性、有效性和效率。我们在CLRec的基础上进行了进一步的改进,提出了Multi-CLRec来精确地减少多意图感知偏差。我们的方法已经在淘宝上成功应用,至少四个月的在线A/B测试和线下分析表明,它有了实质性的改进,包括马太效应的显著降低。
链接:https://arxiv.org/pdf/2005.12964.pdf
推荐理由:本文使用对比学习的方法来解决推荐系统中的popularity bias,并且在工业系统中得到了应用,具有较高的理论与应用价值。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢