字节跳动高伟豪：训练目标不一致？损失无法学习？深度召回解难题！

传统的召回算法一般基于双塔结构并加以approximately nearest neighbor search (ANN) 或者maximum inner productive search (MIPS)，比如fast ball tree (FBT)，hierarchical navigable small world (HNSW) 等。这些传统的算法embedding的训练目标和ANN的目标不一致，导致ANN的损失无法学习。目前比较著名的解决思路是构建一个tree-based model如TDM等。

本文将介绍字节跳动AML Team在大规模推荐中构建的可学习的索引结构，使得embedding的训练目标和索引结构的训练目标可以一致学习，达到良好的召回效果，它不仅局限于广告业务，在推荐和搜索业务中也有应用。

将从以下几方面展开：