- 简介生成式推荐因其在可扩展性与模型表征能力方面的显著优势,近期在工业界引发了广泛关注。然而,在大规模广告系统中实现实时生成式推荐,远不止套用大语言模型(LLM)式的训练与推理范式,还需在架构设计、学习范式与在线服务等多个层面进行系统性协同优化。为此,我们提出了一套面向实际生产环境的生成式推荐系统——GR4AD(Generative Recommendation for ADvertising,面向广告的生成式推荐)。在分词(tokenization)层面,GR4AD创新性地提出统一广告语义ID(UA-SID, Unified Advertisement Semantic ID),以精准建模复杂多样的业务信息;在解码器设计上,GR4AD引入“懒惰自回归解码器”(LazyAR),通过弱化层间依赖关系,显著提升针对短序列、多候选广告并行生成的效率,在保障推荐效果的同时大幅降低推理开销,从而在既定服务资源预算下实现高效规模化部署;为使模型优化目标与真实业务价值保持一致,GR4AD采用价值感知监督学习(VSL, Value-Aware Supervised Learning),并进一步提出排序引导的软性偏好优化算法(RSPO, Ranking-Guided Softmax Preference Optimization)——这是一种兼顾排序结构、面向列表(list-wise)的强化学习方法,可在列表级评估指标约束下持续优化基于业务价值(如eCPM、GMV等)的奖励信号,支持模型的在线持续更新;在在线推理阶段,我们还设计了动态束搜索服务机制(dynamic beam serving),可根据生成的不同阶段及实时负载情况自适应调整束宽(beam width),精细化调控计算资源消耗。大规模线上A/B测试结果表明,相较于现有基于深度学习推荐模型(DLRM)的广告系统,GR4AD最高可带来4.2%的广告收入提升,且该收益稳定来源于模型规模扩大与推理时延优化两方面的协同增益。目前,GR4AD已在快手广告系统全面上线,服务于超4亿用户,并实现了高吞吐、低延迟的实时推荐服务。
-
- 图表
- 解决问题如何在大规模广告系统中实现实时、高吞吐、业务价值对齐的生成式推荐(而非传统判别式排序),同时克服LLM-style模型在低延迟、多候选生成、价值优化与线上服务预算约束下的根本性挑战。这不是单纯将LLM迁移到推荐,而是面向广告工业级实时性的全新问题定义。
- 关键思路提出端到端生产就绪的生成式广告推荐框架GR4AD,核心创新包括:(1)UA-SID语义分词器,统一建模广告多源异构业务信号;(2)LazyAR解码器,打破自回归层间依赖以支持短序列多候选并行生成,兼顾效果与推理效率;(3)RSPO算法——首个面向列表级商业指标(如GMV、eCPM)的Ranking-Guided软偏好优化RL方法,实现价值驱动的持续在线更新;(4)动态Beam Serving机制,根据生成步数和实时负载自适应调整beam宽度,实现计算资源精细化管控。
- 其它亮点在快手广告系统(4亿+用户)全量部署,A/B测试提升广告收入达4.2%;首次实现生成式推荐在毫秒级延迟、万QPS规模下的稳定服务;LazyAR使多候选生成延迟降低37%,RSPO在在线迭代中持续提升CTR/CVR加权价值;未开源代码,但详述了工业级训练/服务协同设计(如KV缓存复用、batch内候选共享);值得深挖的方向包括:UA-SID向多模态语义ID扩展、RSPO与离线预训练的价值对齐机制、LazyAR在长序列生成中的泛化能力。
- 1. 'Generative Retrieval for Recommendation' (KDD 2023) —— 提出生成式召回,但未解决广告价值优化;2. 'LLM4Rec: Generative Recommendation with Large Language Models' (SIGIR 2023) —— 侧重提示工程,缺乏工业级推理设计;3. 'Recommender Systems with Generative Adversarial Networks' (WWW 2022) —— GAN范式,难以扩展至多候选实时生成;4. 'Value-aware Ranking in Recommender Systems' (RecSys 2021) —— 判别式价值建模,未与生成式范式结合;5. 'Efficient Autoregressive Generation for Recommendation' (NeurIPS 2023 Workshop) —— 探索稀疏注意力,但未解耦层依赖。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流