简介:点击后转化率(CVR)的预测是在一系列工业应用中发现用户兴趣和增加平台收入的一项重要任务。这项任务中最具挑战性的问题之一是存在严重的选择偏差,这是由用户固有的自我选择行为和系统的项目选择过程造成的。目前,双重稳健(DR)学习方法在去偏移CVR预测方面取得了最先进的性能。然而,在本文中,通过对DR方法的偏差、方差和泛化界进行理论分析,我们发现现有的DR方法可能由于对倾向得分的不准确估计和归因错误而导致泛化效果不佳,这在实践中经常发生。在这种分析的激励下,我们提出了一个广义的学习框架,它不仅统一了现有的DR方法,而且还提供了一个宝贵的机会来开发一系列新的去偏移技术,以适应不同的应用场景。基于该框架,我们提出了两种新的DR方法,即DR-BIAS和DR-MSE。DR-BIAS直接控制了DR损失的偏差,而DR-MSE则灵活地平衡了偏差和变异,实现了更好的泛化性能。此外,我们还为CVR预测中的DR-MSE提出了一种新的三层联合学习优化方法,以及相应的高效训练算法。我们在真实世界和半合成数据集上进行了广泛的实验,验证了我们提出的方法的有效性。
论文地址:https://web.archive.org/web/20220820220946id_/https://dl.acm.org/doi/pdf/10.1145/3534678.3539270
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢