Zero-Shot Cross-Lingual Reranking with Large Language Models for Low-Resource Languages

向作者提问

NEW

简介

大型语言模型（LLMs）在各种文档重新排序任务中展示了令人印象深刻的零-shot能力。尽管它们得到了成功的实现，但现有文献中对它们在低资源语言中的有效性仍存在差距。为了填补这一空白，我们研究了LLMs在非洲语言的跨语言信息检索（CLIR）系统中作为重新排序器的功能。我们的实现涵盖了英语和四种非洲语言（豪萨语、索马里语、斯瓦希里语和约鲁巴语），并且我们检查了在英语查询和非洲语言段落中进行跨语言重新排序的情况。此外，我们分析和比较了使用查询和文档翻译的单语言重新排序的有效性。我们还评估了LLMs在利用其自己生成的翻译时的有效性。为了了解多个LLMs的有效性，我们的研究重点关注专有模型RankGPT-4和RankGPT-3.5，以及开源模型RankZephyr。虽然重新排序在英语中仍然最有效，但我们的结果表明，跨语言重新排序可能会与非洲语言的重新排序具有竞争力，这取决于LLM的多语言能力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

研究如何在非洲语言的跨语言信息检索系统中使用大型语言模型作为重新排序器，并探讨其效果。该问题是当前领域的新问题。
关键思路

使用大型语言模型作为跨语言信息检索系统中的重新排序器，并比较其与传统翻译方法的效果。同时，比较不同大型语言模型的效果，包括专有模型RankGPT-4和RankGPT-3.5以及开源模型RankZephyr。
其它亮点

论文涉及英语和四种非洲语言（豪萨语、索马里语、斯瓦希里语和约鲁巴语）的跨语言信息检索系统，并分析了使用大型语言模型作为重新排序器的效果。研究发现，跨语言重新排序可以与非洲语言的重新排序相竞争，具体取决于大型语言模型的多语言能力。实验使用了多个数据集，并比较了不同模型的效果。论文提供了开源代码。
相关研究

最近的相关研究包括《Zero-shot Cross-lingual Transfer with Meta Learning》、《Multilingual and Cross-lingual Information Retrieval in the Twenty-First Century: A Survey of the State of the Art》等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问