- 简介推荐系统已经广泛应用于电子商务领域,而重新排序模型在该领域中发挥着越来越重要的作用,利用了物品之间的相互影响,并确定了最终的推荐列表。在线学习方法通过使用最新的可用样本更新已部署模型,以捕捉电子商务中基础数据分布的变化。然而,它们依赖于实时用户反馈的可用性,这可能会被延迟几个小时甚至几天,例如物品购买,导致模型改进的滞后。本文提出了一种新颖的在线学习方法扩展重新排序建模,我们称之为LAST,即学习服务时间。它通过使用代理模型来提供所需的指令信号来引导模型改进,从而避免了对用户反馈的要求。在收到在线请求后,LAST会在生成请求的推荐结果之前找到并应用模型修改。修改是请求特定和短暂的,这意味着修改是针对当前请求量身定制的,以捕捉请求的特定上下文。请求完成后,修改将被丢弃,这有助于防止错误传播并稳定在线学习过程,因为代理模型的预测可能不准确。最重要的是,作为基于反馈的在线学习方法的补充,LAST可以无缝地集成到现有的在线学习系统中,以创建更具适应性和响应性的推荐体验。全面的离线和在线实验证实,LAST优于最先进的重新排序模型。
-
- 图表
- 解决问题论文提出一种名为LAST的在线学习方法,用于电子商务中的重新排名模型,以解决在线学习方法依赖用户反馈的问题。
- 关键思路LAST使用一个代理模型来提供指导信号,以引导模型的改进,而无需等待用户反馈。它在收到在线请求时,在生成推荐结果之前动态地找到并应用模型修改。修改是针对当前请求的,是瞬时的,并且在请求之后被丢弃,以防止错误传播。
- 其它亮点论文的实验结果表明,LAST优于当前最先进的重新排名模型。实验使用了公开的数据集,同时提供了开源代码。LAST可以与基于反馈的在线学习方法无缝集成,从而创建一个更具适应性和响应性的推荐体验。
- 与LAST相关的研究包括基于反馈的在线学习方法和重新排名模型,以及使用代理模型的在线学习方法。其中一些研究包括“Real-time Personalization using Embeddings for Search Ranking at Airbnb”和“Online Learning to Rank for E-commerce with Dynamic Pricing”。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流