介绍阿里巴巴2021年的一篇文章:《One Model to Serve All: Star Topology Adaptive Recommender for Multi-Domain CTR Prediction》。该文章提出的方法可以只使用一种模型,便可以服务于多种CTR业务场景。这些业务场景中可能会共享一些user和item,也有自己独立的user和item。相比于传统方法中的一个模型对应一种业务,该方法既可以减少多个模型带来的维护成本与计算资源,也可以共享不同业务场景下的数据。

论文链接:https://arxiv.org/abs/2101.11427

图1:(a)单场景CTR预估模型。(b):Multi-Domain CTR预估模型。

本文首先提出了不同业务场景下,数据互相共享互补提升的思路,提出了一种使用单个模型服务于多种业务场景的任务。将其称之为 multi-domain CTR prediction,「即模型需要同时预测在业务场景下的点击率。模型以作为输入,其中为输入特征,为点击标签,为不同业务场景的标识」。其中由不同业务场景下的分布得到。为了充分利用不同业务场景下的数据,该文章提出了以下3种模块:

  1. 「Partitioned Normalization (PN)」: 可以针对不同业务场景下不同的数据分布做定制化归一化。
  2. 「Star topology fully-connected neural network」: 文章提出了Star Topology Adaptive Recommender(STAR) 来解决多领域的CTR预估问题。该网络可以充分利用多个业务中的数据来提升各自业务的指标。
  3. 文章提出了一种「辅助网络」(auxiliary network),直接以业务场景的标识(domain indicator)作为输入,来使得网络更好的感知不同场景下的数据分布。

内容中包含的图片若涉及版权问题,请及时与我们联系删除