Improving Retrieval in Sponsored Search by Leveraging Query Context Signals

2024年07月19日
  • 简介
    在赞助搜索中,准确检索用户查询的相关出价关键词至关重要,但对于短、模糊的查询来说,这仍然是具有挑战性的。现有的密集和生成式检索模型往往无法捕捉这些情况下微妙的用户意图。为了解决这个问题,我们提出了一种增强查询理解的方法,通过从网络搜索结果和大型语言模型中获取丰富的上下文信号来增强查询。这些信号存储在在线缓存中。具体而言,我们使用网络搜索标题和摘要来将查询与现实世界的信息联系起来,并利用GPT-4生成查询重写和解释,以澄清用户意图。这些信号通过基于融合解码器的Unity架构高效地集成,实现了密集和生成式检索,与传统的无上下文模型的服务成本相当。为了解决缓存中没有上下文的情况,我们引入了上下文扫视这一课程学习策略,即使在推理过程中没有上下文信号,也可以提高模型的鲁棒性和性能。广泛的离线实验表明,我们的上下文感知方法明显优于无上下文模型。此外,对160多个国家的一家知名搜索引擎进行在线A/B测试显示,用户参与度和收入有显著提高。
  • 图表
  • 解决问题
    本文旨在解决Sponsored Search中的关键词检索问题,特别是对于短、模糊的查询。现有的密集和生成式检索模型在这些情况下往往无法捕捉到用户意图的微妙差别。
  • 关键思路
    本文提出了一种增强查询理解的方法,通过从网络搜索结果和大型语言模型中获取丰富的上下文信号,存储在在线缓存中。具体而言,使用网络搜索标题和片段将查询与现实世界信息联系起来,并利用GPT-4生成查询重写和解释,以澄清用户意图。通过基于Fusion-in-Decoder的Unity架构高效地集成这些信号,实现密集和生成式检索,服务成本与传统无上下文模型相当。
  • 其它亮点
    本文的亮点包括提出了一种新的增强查询理解的方法,使用了网络搜索结果和大型语言模型,以及使用了上下文窥视的课程学习策略。实验结果表明,本文的方法明显优于无上下文模型。在线A/B测试还表明,在160多个国家的知名搜索引擎上,用户参与度和收入都有显著提高。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如《Neural Information Retrieval: At the End of the Early Years》、《Deep Relevance Ranking Using Enhanced Document-Query Interactions》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论