OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search

2025年09月03日
  • 简介
    传统的电子商务搜索系统采用多阶段级联架构(MCA),通过召回、预排序和排序等阶段逐步筛选商品。尽管这种架构在计算效率与业务转化之间取得了良好平衡,但由于各阶段存在计算割裂和优化目标冲突的问题,其整体性能上限受到限制。为解决这些问题,我们提出了\textbf{OneSearch},这是首个在工业场景中部署的端到端生成式电商搜索框架。该框架包含三项关键技术突破:(1)关键词增强的分层量化编码(KHQE)模块,在保持强查询-商品相关性约束的同时,保留了商品的分层语义特征和独特属性;(2)多视角用户行为序列注入策略,通过构建行为驱动的用户ID,融合显式的短期行为序列与隐式的长期行为序列,全面建模用户偏好;(3)偏好感知奖励系统(PARS),结合多阶段监督微调与自适应奖励加权排序机制,精准捕捉细粒度的用户偏好。在大规模工业数据集上的大量离线实验表明,OneSearch在高质量召回与排序方面表现卓越。严格的线上A/B测试验证了其在相同曝光位置提升搜索相关性的能力,关键指标均取得统计显著的提升:商品点击率(CTR)提升+1.67%,买家数提升+2.40%,订单量提升+3.22%。此外,OneSearch将运营成本降低了75.40%,模型FLOPs利用率从3.26%大幅提升至27.32%。该系统已在快手多个搜索场景中成功上线,服务数百万用户,日均产生数千万次页面浏览量。
  • 作者讲解
  • 图表
  • 解决问题
    传统电商搜索系统采用多阶段级联架构(MCA),在召回、预排序和排序阶段之间存在计算割裂和优化目标冲突,导致性能上限受限。论文试图解决这种碎片化带来的效率与效果瓶颈,探索是否可以通过端到端生成式框架提升搜索质量与系统效率。这是一个工业界长期面临的实际问题,尽管已有研究尝试优化单个阶段,但整体端到端重构仍属较新方向。
  • 关键思路
    提出OneSearch——首个工业部署的端到端生成式电商搜索框架。其核心创新包括:(1) 关键词增强的分层量化编码(KHQE),在压缩表示中保留层次语义与商品特征并强化查询-商品相关性;(2) 多视角用户行为序列注入机制,融合显式的短期与隐式的长期行为建模用户偏好;(3) 偏好感知奖励系统(PARS),结合多阶段监督微调与自适应奖励加权排序,精细捕捉用户意图。相比现有工作,首次实现从召回至排序全链路统一建模,打破传统MCA的阶段性隔离。
  • 其它亮点
    在大规模工业数据集上进行了离线评估,并通过严格的线上A/B测试验证:CTR提升+1.67%,买家数+2.40%,订单量+3.22%,且在同一曝光位置显著改善相关性。系统部署于快手多个搜索场景,日均处理数千万PV,服务百万级用户。同时带来巨大工程收益:OPEX降低75.4%,模型FLOPs利用率从3.26%提升至27.32%。代码未提及开源,但强调工业落地可行性,未来可探索其生成式架构向推荐、广告等系统的迁移应用。
  • 相关研究
    1. Towards End-to-End Neural Information Retrieval with Generative Models 2. Deep Intent Prediction for Search 3. UniRank: A Unified Learning-to-Rank Framework 4. Large-Scale Deep Learning for Recommender Systems: Challenges and Trends 5. Behavior Sequence Transformer for E-commerce Search
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问