ACL2020：线上搜索结果大幅提升！亚马逊提出对抗式query-doc相关性模型

搜索和推荐经常会被放在一起对比，其中最突出的区别就是搜索中存在query，需要充分考虑召回内容和query之间的相关性，而如果内容是搜索广告，则对内容有更高的要求，相关性过低的内容被展示会让用户有很差的体验。

相关性在一定程度上可以被抽象成doc和query之间的语义相似度问题，其实当前语义相似度的研究已经非常成熟，在sigir2018中有人曾经对搜索和推荐中的深度学习匹配进行了非常全面的综述：Deep Learning for Matching in Search and Recommendation。在语义匹配上，大家的关注点经常在于如何去定义“匹配”上，尤其是分析如何将两者的编码内容更好地匹配起来。

虽然语义相似度问题已经有很多解决办法了，然而事实上，在应用过程中，相关性和相似度还是有着很大的差距，因为搜索内容的细微变化会带来较大的语义意图变化。比如用户想买“手机充电器”，但结果出了“手机壳”。虽然两者有一定的相似度，但明显是不相关的。回过头来谈搜索广告，搜索广告是搜索中商（zhuan）业（qian）化的一环，希望的是能给到用户尽可能接触的东西尽可能相关，本来广告点的人就少，还无关就更凉凉了。

不慌，今天就介绍一个最新方法，来自亚马逊ACL20的《Learning Robust Models for e-Commerce Product Search》，文章主要用在商品搜索的场景下，目的是判断query和item/doc之间的相关性。文中提出了一个与“对抗生成网络”类似结构的模型，其中的判别器能够衡量query和doc之间的相关性，判断两者是否相关，生成器则能够生成与query相似却不相关的doc，借助类似对抗生成网络模式的训练，能够在较多噪音数据下，仍尽可能保证模型的鲁棒性。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ACL2020：线上搜索结果大幅提升！亚马逊提出对抗式query-doc相关性模型

评论列表

评论