论文标题:

MISS: Multi-Interest Self-Supervised Learning Framework for Click-Through Rate Prediction

论文链接:

https://arxiv.53yu.com/pdf/2111.15068.pdf

本文针对CTR预估提出的自监督方法MISS,针对现存问题:

  • 标签稀疏(即用户-商品交互相对于特征空间高度稀疏)、
  • 标签噪声(即收集的用户-商品交互通常是嘈杂的)的风险,
  • 未充分利用领域知识(即样本之间的成对相关性)。

本文提出了一种新颖的多兴趣自我监督学习(MISS)框架,该框架通过兴趣级别的自监督信号增强了特征embedding。在两个新的基于 CNN 的多兴趣提取器的帮助下,使用两个基于CNN的兴趣提取器考虑不同兴趣表征(逐点(point)和联合(union))、兴趣依赖性(短期(short range)和长期(long range))以及兴趣相关性(商品间和商品内)。并利用对比学习增强特征的表征学习。

本文特点

  • 采用CNN挖掘相邻不同商品之间的交互和相同商品不同属性之间的影响,使用不同大小的卷积核来考虑序列中的长短期关系
  • 通过在兴趣级别上的对比学习,增强模型对噪声和稀疏数据的鲁棒性

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除