Sabiá-2: A New Generation of Portuguese Large Language Models

简介

我们介绍了Sabi'a-2，这是一系列在葡萄牙语文本上训练的大型语言模型。我们对这些模型进行了多样化的考试评估，包括巴西大学的入门考试、专业认证考试，以及各种学科的研究生考试，如会计、经济、工程、法律和医学等。我们的结果显示，我们迄今为止最好的模型Sabi'a-2 Medium在64个考试中有23个能够与GPT-4的表现相匹配或超越其表现，并在64个考试中有58个优于GPT-3.5。值得注意的是，专业化对模型的表现有显著影响，而不需要增加模型的大小，这使我们能够以每个标记的价格比GPT-4便宜10倍的价格提供Sabi'a-2 Medium。最后，我们发现数学和编码是需要改进的关键能力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在介绍Sabiá-2，一种针对葡萄牙语文本的大型语言模型，并在各种考试中进行评估，以验证其性能。此外，论文还试图确定需要改进的关键能力。
关键思路

Sabiá-2是一种针对葡萄牙语文本的大型语言模型，其性能在多种考试中进行了评估。论文表明，Sabiá-2 Medium模型的性能与GPT-4相当或更好，在58个考试中优于GPT-3.5。此外，论文发现数学和编码是需要改进的关键能力。
其它亮点

论文使用了多种数据集，并提供了Sabiá-2 Medium模型的价格优势。此外，论文确定了数学和编码是需要改进的关键能力。
相关研究

最近的相关研究包括对其他语言的大型语言模型的研究，如英语和中文。例如，GPT-3是英语语言模型方面的一个重要研究成果。

Sabiá-2: A New Generation of Portuguese Large Language Models

提问交流

提问交流