论文标题:
MISS: Multi-Interest Self-Supervised Learning Framework for Click-Through Rate Prediction
论文链接:
https://arxiv.53yu.com/pdf/2111.15068.pdf
本文针对CTR预估提出的自监督方法MISS,针对现存问题:
-
标签稀疏(即用户-商品交互相对于特征空间高度稀疏)、 -
标签噪声(即收集的用户-商品交互通常是嘈杂的)的风险, -
未充分利用领域知识(即样本之间的成对相关性)。
本文提出了一种新颖的多兴趣自我监督学习(MISS)框架,该框架通过兴趣级别的自监督信号增强了特征embedding。在两个新的基于 CNN 的多兴趣提取器的帮助下,使用两个基于CNN的兴趣提取器考虑不同兴趣表征(逐点(point)和联合(union))、兴趣依赖性(短期(short range)和长期(long range))以及兴趣相关性(商品间和商品内)。并利用对比学习增强特征的表征学习。
本文特点:
-
采用CNN挖掘相邻不同商品之间的交互和相同商品不同属性之间的影响,使用不同大小的卷积核来考虑序列中的长短期关系 -
通过在兴趣级别上的对比学习,增强模型对噪声和稀疏数据的鲁棒性

内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢