Sabiá-2: A New Generation of Portuguese Large Language Models

2024年03月14日
  • 简介
    我们介绍了Sabi'a-2,这是一系列在葡萄牙语文本上训练的大型语言模型。我们对这些模型进行了多样化的考试评估,包括巴西大学的入门考试、专业认证考试,以及各种学科的研究生考试,如会计、经济、工程、法律和医学等。我们的结果显示,我们迄今为止最好的模型Sabi'a-2 Medium在64个考试中有23个能够与GPT-4的表现相匹配或超越其表现,并在64个考试中有58个优于GPT-3.5。值得注意的是,专业化对模型的表现有显著影响,而不需要增加模型的大小,这使我们能够以每个标记的价格比GPT-4便宜10倍的价格提供Sabi'a-2 Medium。最后,我们发现数学和编码是需要改进的关键能力。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在介绍Sabiá-2,一种针对葡萄牙语文本的大型语言模型,并在各种考试中进行评估,以验证其性能。此外,论文还试图确定需要改进的关键能力。
  • 关键思路
    Sabiá-2是一种针对葡萄牙语文本的大型语言模型,其性能在多种考试中进行了评估。论文表明,Sabiá-2 Medium模型的性能与GPT-4相当或更好,在58个考试中优于GPT-3.5。此外,论文发现数学和编码是需要改进的关键能力。
  • 其它亮点
    论文使用了多种数据集,并提供了Sabiá-2 Medium模型的价格优势。此外,论文确定了数学和编码是需要改进的关键能力。
  • 相关研究
    最近的相关研究包括对其他语言的大型语言模型的研究,如英语和中文。例如,GPT-3是英语语言模型方面的一个重要研究成果。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问