mCoT: Multilingual Instruction Tuning for Reasoning Consistency in Language Models

简介

大型语言模型（LLMs）与思维链（CoT）最近作为一种强大的技术出现，用于引导推理以改进各种下游任务。由于大多数研究主要关注英语，而在多语言环境中进行的探索很少，因此不同语言的这种推理能力的可靠性问题仍然存在。为了直接解决这个问题，我们使用流行的开源LLMs研究了跨多种语言的多语言推理一致性。首先，我们编制了第一个大规模的跨11种不同语言的数学推理数据集mCoT-MATH。然后，我们引入了多语言CoT指令调整来提高跨语言的推理能力，从而提高模型的一致性。虽然现有的LLMs在我们考虑的语言中存在相当大的差异，尤其是对于资源较少的语言表现不佳，但我们的7B参数模型mCoT在不同语言之间实现了令人印象深刻的一致性，并且在大小远远超过它的闭源和开源模型中具有优越或可比的性能。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在研究多语言推理一致性，使用开源LLMs，并编译第一个大规模多语言数学推理数据集mCoT-MATH，探讨LLMs在不同语言中推理能力的可靠性。
关键思路

通过引入多语言CoT指令调整，提高模型的推理能力，从而提高模型在不同语言中的一致性。mCoT模型表现出令人印象深刻的跨语言一致性，且性能优于其他开源和私有模型。
其它亮点

本文编译了第一个大规模多语言数学推理数据集mCoT-MATH，提出了多语言CoT指令调整方法，提高了跨语言一致性。实验结果表明，mCoT模型在不同语言中具有优秀的一致性和性能。
相关研究

最近相关研究包括：《Cross-lingual Language Model Pretraining》、《Unsupervised Cross-lingual Representation Learning at Scale》、《Multilingual Denoising Pre-training for Neural Machine Translation》等。

mCoT: Multilingual Instruction Tuning for Reasoning Consistency in Language Models

提问交流

提问交流