阿里妈妈展示广告需要为大量的场景提供广告排序能力,在业务场景数急剧膨胀的背景下,我们开始研究多场景联合建模。本篇文章主要介绍,我们在多场景建模下遇到的挑战、挑战背后的思考以及算法工程 co-design 的解决方案——多场景下的星型 CTR 预估模型 STAR。该项工作论文已被CIKM 2021接收。 

论文下载:https://arxiv.org/pdf/2101.11427

作者总结了多场景建模的三个挑战:1)场景数多且存在长尾问题;2)不同场景样本分布差异大;3)人力和资源的限制。本文建模重点是有效利用场景间共性并建模不同场景差异性,同时打造一套兼顾效能,可快速迭代的建模体系。

对于多场景建模问题,本文的核心想法是同时学习场景内特定行为和场景间的共性行为。沿着这个想法,提出了 STAR 模型,通过场景私有参数和场景共享参数同时建模场景差异性和共性。场景私有参数以及场景共享参数最终聚合得到每个场景的模型。STAR 的结构如下图所示。

STAR 主要包含三部分,星型拓扑结构的全连接网络(STAR Topology Fully-Connected Network),Partitioned Normalization 以及辅助网络。

在展示广告生产数据集上进行实验,对比方法包括 Base (共享模型),Shared-Bottom, MulANN, MMoE, Cross-Stitch。实验结果显示,STAR 可以一致的提升各个场景的表现。

在真实生产环境的流式训练环境下,作者重新设计了样本管线,将样本流拆分为多个场景,轮流输出进行训练,每个 batch 仅包含一个场景样本。为了缓解不同场景流量高峰不同的 “跷跷板”效应,ODL 会缓存并 shuffle 样本,确保每个时刻样本分布不会发生突变。STAR 上线后,在不额外增加特征、算力、RT 的情况下,取得了 ctr+8% rpm+6% 的效果。

内容中包含的图片若涉及版权问题,请及时与我们联系删除