信息检索的核心是从大规模资源中识别出相关信息,并以排序列表的形式返回,以响应用户的信息需求。近年来,随着深度学习的兴起,这一领域得到了极大的发展,神经信息检索(NeuIR)成为一个热门话题,尤其是预训练方法范式(PTMs)。预训练模型具有复杂的预训练目标和庞大的模型规模,可以从海量文本数据中学习通用语言表示,这有利于IR的排序任务。由于已经有大量的工作致力于PTMs在IR中的应用,我们认为现在是总结现状,学习现有方法,并获得一些对未来发展的见解的时候了。本文综述了信息检索系统中检索分量、重排序分量和其他分量的PTMs应用情况。此外,我们还介绍了专门为IR设计的PTMs,并总结了可用的数据集和基准排行榜。此外,我们讨论了一些开放的挑战和展望了一些有前途的方向,希望为未来的研究激发更多关于这些主题的工作。
论文链接:https://arxiv.org/pdf/2111.13853.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢