TF4CTR: Twin Focus Framework for CTR Prediction via Adaptive Sample Differentiation

2024年05月06日
  • 简介
    在工业推荐系统中,有效的特征交互建模对于提高点击率(CTR)预测的准确性至关重要。目前大多数深度CTR模型都采用构建复杂的网络架构来更好地捕捉复杂的特征交互或用户行为。然而,我们发现这些模型存在两个限制:(1)向模型提供的样本是无差别的,这可能导致模型单一地学习更多容易的样本而忽略更少的难样本,从而降低模型的泛化能力;(2)不同的特征交互编码器被设计用于捕捉不同的交互信息,但接收到一致的监督信号,从而限制了编码器的有效性。为了弥补这些差距,本文引入了一种新的CTR预测框架,通过整合插拔式的双重关注(TF)损失、样本选择嵌入模块(SSEM)和动态融合模块(DFM)来命名该框架为CTR的双重关注框架(TF4CTR)。具体来说,该框架在模型底部使用SSEM来区分样本,从而为每个样本分配更合适的编码器。同时,TF Loss为简单和复杂的编码器提供量身定制的监督信号。此外,DFM动态地融合编码器捕捉的特征交互信息,从而实现更准确的预测。在五个真实数据集上的实验证实了该框架的有效性和兼容性,并展示了它以一种与模型无关的方式增强各种代表性基线的能力。为了方便可重复的研究,我们的开源代码和详细的运行日志将在https://github.com/salmon1802/TF4CTR上提供。
  • 图表
  • 解决问题
    论文旨在提高工业推荐系统中CTR预测的准确性,通过解决当前CTR模型中样本无差别和特征交互编码器设计不充分的问题来实现目标。
  • 关键思路
    论文提出了一种新的CTR预测框架,称为Twin Focus Framework for CTR (TF4CTR),其中包括Sample Selection Embedding Module (SSEM)、Twin Focus (TF) Loss和Dynamic Fusion Module (DFM)。该框架通过SSEM在模型底部区分样本,为每个样本分配更适合的编码器;TF Loss为简单和复杂编码器提供定制的监督信号;DFM动态融合编码器捕获的特征交互信息,从而提高预测准确性。
  • 其它亮点
    论文在五个真实数据集上进行了实验,证明了该框架的有效性和兼容性,并证明了它在模型无关的情况下增强了各种代表性基线。此外,论文还开源了代码和详细的运行日志。
  • 相关研究
    最近的相关研究包括《Deep Interest Network for Click-Through Rate Prediction》、《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论