Do Not Wait: Learning Re-Ranking Model Without User Feedback At Serving Time in E-Commerce

向作者提问

NEW

简介

推荐系统已经广泛应用于电子商务领域，而重新排序模型在该领域中发挥着越来越重要的作用，利用了物品之间的相互影响，并确定了最终的推荐列表。在线学习方法通过使用最新的可用样本更新已部署模型，以捕捉电子商务中基础数据分布的变化。然而，它们依赖于实时用户反馈的可用性，这可能会被延迟几个小时甚至几天，例如物品购买，导致模型改进的滞后。本文提出了一种新颖的在线学习方法扩展重新排序建模，我们称之为LAST，即学习服务时间。它通过使用代理模型来提供所需的指令信号来引导模型改进，从而避免了对用户反馈的要求。在收到在线请求后，LAST会在生成请求的推荐结果之前找到并应用模型修改。修改是请求特定和短暂的，这意味着修改是针对当前请求量身定制的，以捕捉请求的特定上下文。请求完成后，修改将被丢弃，这有助于防止错误传播并稳定在线学习过程，因为代理模型的预测可能不准确。最重要的是，作为基于反馈的在线学习方法的补充，LAST可以无缝地集成到现有的在线学习系统中，以创建更具适应性和响应性的推荐体验。全面的离线和在线实验证实，LAST优于最先进的重新排序模型。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文提出一种名为LAST的在线学习方法，用于电子商务中的重新排名模型，以解决在线学习方法依赖用户反馈的问题。
关键思路

LAST使用一个代理模型来提供指导信号，以引导模型的改进，而无需等待用户反馈。它在收到在线请求时，在生成推荐结果之前动态地找到并应用模型修改。修改是针对当前请求的，是瞬时的，并且在请求之后被丢弃，以防止错误传播。
其它亮点

论文的实验结果表明，LAST优于当前最先进的重新排名模型。实验使用了公开的数据集，同时提供了开源代码。LAST可以与基于反馈的在线学习方法无缝集成，从而创建一个更具适应性和响应性的推荐体验。
相关研究

与LAST相关的研究包括基于反馈的在线学习方法和重新排名模型，以及使用代理模型的在线学习方法。其中一些研究包括“Real-time Personalization using Embeddings for Search Ranking at Airbnb”和“Online Learning to Rank for E-commerce with Dynamic Pricing”。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问