作者:Tan Yu, Jie Liu, Yi Yang,等

简介:通信技术的进步和智能手机的普及,促进了视频广告的蓬勃发展。百度作为全球领先的搜索引擎公司之一,每天收到数十亿的搜索查询。如何将视频广告与用户搜索配对是百度视频广告的核心任务。由于模态差异,视频检索查询比传统的文档检索查询和图像检索查询更具挑战性。传统上,对视频检索的查询是通过对标题的查询来处理的;但如果分片质量不高时,这种查询是不可靠的。近年来,随着计算机视觉和自然语言处理技术的飞速发展,基于内容的搜索方法在视频检索中的应用前景广阔。得益于对大规模数据集的预处理,一些基于跨模态注意的visionBERT方法:不仅在学术界,而且在工业界,在许多视觉语言任务中都取得了优异的性能。然而,跨模态注意的昂贵计算成本,使得在工业应用中进行大规模搜索不切实际。在这项工作中,作者提出了一个最近在百度动态视频广告平台中推出的基于树的组合注意力网络(TCAN),TCAN提供了一种实用的解决方案、可以将大规模查询的跨模态注意力部署到视频搜索中。启动基于树的组合注意力网络后,点击率提高了 2.29%,转化率提高了 2.63%。

论文下载:https://arxiv.org/pdf/2209.08759.pdf

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除