KLUE(https://klue-benchmark.com)提供一系列数据集,用于评估韩国语言模型的自然语言理解能力(论文)。KLUE由8个不同的、有代表性的任务组成,项目建立了一个评估系统,为每个任务选择评估指标,建立韩语模型之间的比较。

基准由一家韩国企业upstage开发,这家企业的主要业务是为开发者提供AI培训,以及为企业提供AI应用指导。

内容中包含的图片若涉及版权问题,请及时与我们联系删除