Enhancing Relevance of Embedding-based Retrieval at Walmart

2024年08月09日
  • 简介
    Embedding-based neural retrieval (EBR) 是一种在产品搜索中解决客户搜索查询和产品之间词汇差异的有效搜索检索方法。我们在沃尔玛推出 EBR 系统后,取得了显著的相关性和添加到购物车率的提高。然而,尽管 EBR 通常会检索出更相关的产品供重新排序,我们观察到了许多相关性下降的情况。增强检索性能非常重要,因为它直接影响产品重新排序并影响客户的购物体验。导致这些下降的因素包括训练数据中的误报/漏报和无法处理查询拼写错误。为了解决这些问题,我们提出了几种方法,进一步增强我们的 EBR 模型在检索相关性方面的能力。我们引入了一个基于人类相关性反馈的相关性奖励模型 (RRM)。我们利用 RRM 从训练数据中去除噪声,并通过多目标损失将其提炼到我们的 EBR 模型中。此外,我们还提出了一些增强我们 EBR 模型性能的技术,例如拼写错误感知训练和半正样本生成。我们通过离线相关性评估、在线 AB 测试以及成功部署到实际生产中来展示我们 EBR 的有效性。
  • 作者讲解
  • 图表
  • 解决问题
    增强嵌入式神经检索系统的检索准确性和鲁棒性
  • 关键思路
    通过人类相关反馈构建相关奖励模型,并通过多目标损失将其融入EBR模型中,同时采用处理查询拼写错误的技术和半正例生成技术来提高EBR模型的性能
  • 其它亮点
    论文介绍了一种基于人类相关反馈的Relevance Reward Model,用于清除训练数据中的噪声并提高EBR模型的准确性;同时介绍了处理查询拼写错误和半正例生成技术来进一步提高EBR模型的性能;论文通过离线相关性评估、在线AB测试和实际部署等多种方式验证了EBR模型的有效性。
  • 相关研究
    最近的相关研究包括基于嵌入式神经检索的商品搜索和推荐系统的研究,例如《Learning to Hash for Indexing Big Data - A Survey》和《Neural Collaborative Filtering vs. Matrix Factorization Revisited》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问