- 简介点击后转化率(CVR)估计是许多以收入为导向的业务(如电子商务和广告)推荐系统中的关键任务。从样本的角度来看,典型的CVR正样本通常会经历从曝光到点击再到转化的过程。由于未点击样本缺乏事后标签,CVR学习任务通常只利用点击过的样本,而不是像点击率(CTR)学习任务那样使用所有曝光样本。然而,在线推理过程中,CVR和CTR是在相同的假设曝光空间中进行估计的,这导致了训练和推理之间样本空间的不一致,即样本选择偏差(SSB)。为了缓解SSB,先前的研究提出设计新的辅助任务,使CVR学习能够应用于未点击的训练样本,例如CTCVR和反事实CVR等。尽管在一定程度上缓解了SSB,但这些方法在建模过程中都没有关注模糊负样本(未点击)和实际负样本(点击但未转化)之间的区分,这使得CVR模型缺乏鲁棒性。为填补这一空白,我们提出了一种新颖的ChorusCVR模型,以实现整个空间中的无偏CVR学习。
-
- 图表
- 解决问题该论文试图解决在点击后转化率(CVR)估计中由于样本选择偏差(SSB)导致的训练和推理之间样本空间不一致的问题。具体来说,CVR模型通常只使用点击过的样本进行训练,而忽略了未点击的样本,这与CTR学习任务不同,CTR学习任务可以利用所有展示的样本。这种差异导致了模型在实际应用中的鲁棒性和准确性下降。
- 关键思路论文提出了一种名为ChorusCVR的新模型,旨在通过在整个样本空间(包括点击和未点击的样本)上进行CVR学习来减轻样本选择偏差。相比现有方法,ChorusCVR不仅关注如何利用未点击的样本,还特别强调区分模糊的负样本(未点击)和事实上的负样本(点击但未转化),从而提高模型的鲁棒性和准确性。
- 其它亮点1. 论文设计了新颖的实验来验证ChorusCVR模型的有效性,并使用了多个真实世界的数据集进行测试。 2. 提出了区分模糊负样本和事实负样本的方法,这是现有研究中较少涉及的方面。 3. 开源了部分代码和数据集,便于其他研究者复现实验结果并进一步改进模型。 4. 提出的工作为未来的研究提供了新的方向,例如如何更好地处理样本选择偏差以及如何在推荐系统中更有效地结合CTR和CVR学习。
- 最近在这个领域,相关的研究还包括: 1. 'Counterfactual Risk Minimization for Causal Inference from Observational Data' 2. 'Learning to Rank with Selection Bias in E-commerce' 3. 'Deep Interest Network for Click-Through Rate Prediction' 4. 'Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts' 这些研究主要集中在如何处理样本选择偏差、因果推断以及多任务学习等方面,但尚未像ChorusCVR那样明确区分模糊负样本和事实负样本。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流