NevIR: Negation in Neural Information Retrieval
解决问题:本篇论文旨在探究否定词对神经信息检索的影响,并提供一个简单的基准测试。目前,信息检索领域已经广泛采用了语言模型作为现代信息检索体系结构的核心,但是对于神经信息检索中否定词的影响却鲜有研究。该论文的研究问题是一个新问题。
关键思路:该论文的解决方案是构建一个基准测试,要求信息检索模型对仅在否定词上有所不同的两个文档进行排序。研究发现,不同类型的信息检索体系结构表现差异较大,交叉编码器的性能最佳,其次是后交互模型,而双编码器和稀疏神经结构的表现最差。作者发现,大多数当前的信息检索模型并不考虑否定词,表现类似或比随机排序更差。作者还发现,尽管在对比文档数据集上进行持续微调(以及增加模型大小)可以提高性能,但机器和人类的表现之间仍存在巨大差距。相比当前领域的研究状况,该论文的思路在于探究否定词对神经信息检索的影响。
其他亮点:该论文的实验设计基于一个简单的基准测试,使用了一个有关否定词的数据集。作者发现,当前的信息检索模型大多不考虑否定词,因此提出了一种新的思路。该论文没有提供开源代码。该研究表明,否定词是一个重要的研究领域,值得进一步深入研究。
关于作者:Orion Weller、Dawn Lawrie和Benjamin Van Durme是本篇论文的主要作者。他们分别来自美国马里兰大学、卡内基梅隆大学和约翰霍普金斯大学。Orion Weller曾参与撰写名为“Neural Cross-Lingual Entity Linking”的论文,Dawn Lawrie曾参与撰写名为“Learning to Rank Using Gradient Descent”的论文,而Benjamin Van Durme曾参与撰写名为“Learning to Map Sentences to Logical Form: Structured Classification with Probabilistic Categorial Grammars”的论文。
相关研究:最近的相关研究包括:“Neural Information Retrieval with Hierarchical Contextualized Language Models”(Xiaofei Zhu等,清华大学),“Incorporating Knowledge Graphs into Neural Information Retrieval”(Xuan Zhang等,香港中文大学)和“Neural Ranking Models with Weak Supervision”(Xingwu Hu等,南京大学)。
论文摘要:这篇文章讨论了否定词在语言模型中的一些问题,指出目前信息检索领域采用的语言模型对于否定词的处理仍存在不足。作者构建了一个基准测试,要求信息检索模型对两个只有否定词不同的文档进行排序,结果表明不同类型的信息检索模型表现存在巨大差异,交叉编码器表现最好,后交互模型次之,而双编码器和稀疏神经结构模型表现最差。作者发现当前大部分信息检索模型都没有考虑否定词,表现与随机排序相似甚至更差。作者还发现,虽然在对比文档数据集上持续微调和增大模型规模可以提高性能,但机器和人类的表现仍存在较大差距。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢