The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control

2024年05月27日
  • 简介
    2024年将是多维质量度量(MQM)框架用于分析翻译质量评估的10周年。MQM错误分类法已被翻译和本地化行业的从业者广泛使用,并作为许多派生项目的基础。机器翻译年度会议(WMT)的共享任务中,人工和自动翻译质量评估都使用了MQM错误分类法。该指标建立在两个支柱上:错误分类法和评分模型。评分模型从注释数据中计算质量得分,详细说明如何将错误类型和严重程度计数转换为数字分数,以确定内容是否符合规格。以前,只有原始评分模型被发布。今年4月,MQM委员会发布了线性校准评分模型,正式在此介绍,以及之前未发布的非线性评分模型。 本文详细介绍了最新的MQM发展,并提出了一种跨三个样本大小范围的翻译质量测量通用方法。它还解释了为什么应该对非常小的样本量使用统计质量控制,从单个句子开始。
  • 作者讲解
  • 图表
  • 解决问题
    该论文旨在解决翻译质量评估的问题,提出了一种新的多维质量度量框架,同时探讨了如何在小样本情况下使用统计质量控制。
  • 关键思路
    该论文提出了一种基于MQM错误类型和评分模型的通用翻译质量度量方法,并介绍了线性和非线性校准评分模型。这种方法可以在不同的样本大小范围内使用,并且可以在小样本情况下使用统计质量控制。
  • 其它亮点
    该论文介绍了MQM框架的最新发展,并提出了一种通用的翻译质量度量方法。实验使用了WMT共享任务数据集,并公开了开源代码。该方法可以在不同的样本大小范围内使用,并且可以在小样本情况下使用统计质量控制。
  • 相关研究
    最近的相关研究包括神经机器翻译、自动评估方法和多语言翻译质量评估等。相关论文包括:“Neural Machine Translation of Rare Words with Subword Units”、“A METEOR-Based Metric for Evaluating the Quality of Machine Translation Output”等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问