The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control

2024年05月27日
  • 简介
    2024年将是多维质量度量(MQM)框架用于分析翻译质量评估的十周年。MQM错误分类已被翻译和本地化行业从业者广泛使用,并成为许多派生项目的基础。机器翻译年会(WMT)上的人工和自动翻译质量评估共享任务都使用了MQM错误分类。该度量标准基于两个支柱:错误分类和评分模型。评分模型从注释数据中计算质量得分,详细说明如何将错误类型和严重程度计数转换为数字得分,以确定内容是否符合规格。以前,只有原始评分模型被发布。今年4月,MQM委员会发布了线性校准评分模型,正式在此呈现,以及以前未发布的非线性评分模型。本文详细介绍了最新的MQM发展,并提出了一种跨三个样本大小范围的翻译质量测量的通用方法。它还解释了为什么应该针对非常小的样本量(从一句话开始)使用统计质量控制。
  • 图表
  • 解决问题
    MQM框架的线性和非线性评分模型的发布以及如何在不同样本大小范围内进行翻译质量评估
  • 关键思路
    MQM框架的评分模型包括线性和非线性模型,可以用于不同样本大小的翻译质量评估,同时提出了在样本非常小的情况下使用统计质量控制的方法
  • 其它亮点
    MQM框架的错误分类法被广泛应用于翻译和本地化行业,本文提出的评分模型可以更准确地评估翻译质量,同时可以根据样本大小选择不同的评估方法。实验使用了WMT会议的数据集,并公开了代码。
  • 相关研究
    最近的相关研究主要集中在机器翻译领域,例如ACL、EMNLP、WMT等会议上的论文,如ACL 2021的《A Survey of Quality Estimation for Neural Machine Translation》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论