mCoT: Multilingual Instruction Tuning for Reasoning Consistency in Language Models

2024年06月04日
  • 简介
    大型语言模型(LLMs)与思维链(CoT)最近作为一种强大的技术出现,用于引导推理以改进各种下游任务。由于大多数研究主要关注英语,而在多语言环境中进行的探索很少,因此不同语言的这种推理能力的可靠性问题仍然存在。为了直接解决这个问题,我们使用流行的开源LLMs研究了跨多种语言的多语言推理一致性。首先,我们编制了第一个大规模的跨11种不同语言的数学推理数据集mCoT-MATH。然后,我们引入了多语言CoT指令调整来提高跨语言的推理能力,从而提高模型的一致性。虽然现有的LLMs在我们考虑的语言中存在相当大的差异,尤其是对于资源较少的语言表现不佳,但我们的7B参数模型mCoT在不同语言之间实现了令人印象深刻的一致性,并且在大小远远超过它的闭源和开源模型中具有优越或可比的性能。
  • 作者讲解
  • 图表
  • 解决问题
    本文旨在研究多语言推理一致性,使用开源LLMs,并编译第一个大规模多语言数学推理数据集mCoT-MATH,探讨LLMs在不同语言中推理能力的可靠性。
  • 关键思路
    通过引入多语言CoT指令调整,提高模型的推理能力,从而提高模型在不同语言中的一致性。mCoT模型表现出令人印象深刻的跨语言一致性,且性能优于其他开源和私有模型。
  • 其它亮点
    本文编译了第一个大规模多语言数学推理数据集mCoT-MATH,提出了多语言CoT指令调整方法,提高了跨语言一致性。实验结果表明,mCoT模型在不同语言中具有优秀的一致性和性能。
  • 相关研究
    最近相关研究包括:《Cross-lingual Language Model Pretraining》、《Unsupervised Cross-lingual Representation Learning at Scale》、《Multilingual Denoising Pre-training for Neural Machine Translation》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问