Enhancing Relevance of Embedding-based Retrieval at Walmart

2024年08月09日
  • 简介
    Embedding-based neural retrieval (EBR)是一种有效的搜索检索方法,用于解决顾客搜索查询和产品之间的词汇差异。我们在沃尔玛推出的EBR系统初期,取得了显著的相关性和加入购物车率提升[1]。然而,尽管EBR通常检索到更多相关的产品以进行重新排序,但我们观察到许多相关性下降的实例。提高检索性能至关重要,因为它直接影响产品重新排序并影响顾客购物体验。导致这些下降的因素包括训练数据中的误报/漏报和无法处理查询拼写错误。为了解决这些问题,我们提出了几种方法,进一步增强我们的EBR模型的检索相关性能力。我们引入了一种基于人类相关反馈的相关性奖励模型(RRM)。我们利用RRM从训练数据中去除噪声,并通过多目标损失将其提炼到我们的EBR模型中。此外,我们还提出了一些增强我们的EBR模型性能的技术,例如拼写错误感知训练和半正向生成。我们的EBR的有效性通过离线相关性评估、在线AB测试和成功部署到实际生产中得到证明。[1]Alessandro Magnani, Feng Liu, Suthee Chaidaroon, Sachin Yadav, Praveen Reddy Suram, Ajit Puthenputhussery, Sijie Chen, Min Xie, Anirudh Kashi, Tony Lee等人。2022年。沃尔玛的语义检索。在第28届ACM SIGKDD知识发现和数据挖掘会议论文集中。3495-3503。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在通过增强嵌入式神经检索(EBR)模型的能力来提高产品搜索的相关性,解决训练数据中的误差和无法处理查询拼写错误等问题。
  • 关键思路
    论文提出了多个方法来增强EBR模型的能力,包括基于人类相关反馈的相关性奖励模型(RRM)、错别字感知训练和半正样本生成等。
  • 其它亮点
    论文通过离线相关性评估、在线AB测试和实际生产中的成功部署等方式证明了EBR模型的有效性。同时,论文还开源了数据集和代码,为后续的研究提供了便利。
  • 相关研究
    最近的相关研究包括使用深度学习和自然语言处理技术进行产品搜索的研究,如《Deep Learning for Product Matching: A Survey》和《Product Search with Multiple Data Sources》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问