Airbnb搜索的目标是为房客匹配最符合其出行需求的理想住宿。这是一个颇具挑战性的问题,因为热门搜索地点通常有约十万套可入住的房源,而房客自身的偏好也千差万别。此外,诸如“灵活日期搜索”等新功能的推出,进一步大幅增加了每次搜索查询所匹配的合格房源数量。因此,亟需一个复杂的检索系统,能够以低延迟提供高质量的候选结果,并与整体排序体系无缝集成。
本文详细介绍了我们为Airbnb搜索构建高效且高质量检索系统的历程。我们阐述了在像Airbnb这样的双边市场中实施基于嵌入(Embedding-Based Retrieval, EBR)的检索系统时所面临的关键独特挑战,例如房源库存的动态变化、包含多个阶段的冗长用户转化漏斗,以及多样化的前端产品形态。我们还分享了在建模检索问题时的独特见解、如何构建稳健的评估体系,以及在线服务架构中的设计取舍。该EBR系统已上线生产环境,并支持多种应用场景,包括常规搜索、灵活日期搜索,以及用于营销活动的推广邮件。通过A/B测试,该系统在预订转化率等关键指标上均展现出统计学意义上的显著提升。