The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control

向作者提问

NEW

简介

2024年将是多维质量度量（MQM）框架用于分析翻译质量评估的10周年。MQM错误分类法已被翻译和本地化行业的从业者广泛使用，并作为许多派生项目的基础。机器翻译年度会议（WMT）的共享任务中，人工和自动翻译质量评估都使用了MQM错误分类法。该指标建立在两个支柱上：错误分类法和评分模型。评分模型从注释数据中计算质量得分，详细说明如何将错误类型和严重程度计数转换为数字分数，以确定内容是否符合规格。以前，只有原始评分模型被发布。今年4月，MQM委员会发布了线性校准评分模型，正式在此介绍，以及之前未发布的非线性评分模型。本文详细介绍了最新的MQM发展，并提出了一种跨三个样本大小范围的翻译质量测量通用方法。它还解释了为什么应该对非常小的样本量使用统计质量控制，从单个句子开始。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

该论文旨在解决翻译质量评估的问题，提出了一种新的多维质量度量框架，同时探讨了如何在小样本情况下使用统计质量控制。
关键思路

该论文提出了一种基于MQM错误类型和评分模型的通用翻译质量度量方法，并介绍了线性和非线性校准评分模型。这种方法可以在不同的样本大小范围内使用，并且可以在小样本情况下使用统计质量控制。
其它亮点

该论文介绍了MQM框架的最新发展，并提出了一种通用的翻译质量度量方法。实验使用了WMT共享任务数据集，并公开了开源代码。该方法可以在不同的样本大小范围内使用，并且可以在小样本情况下使用统计质量控制。
相关研究

最近的相关研究包括神经机器翻译、自动评估方法和多语言翻译质量评估等。相关论文包括：“Neural Machine Translation of Rare Words with Subword Units”、“A METEOR-Based Metric for Evaluating the Quality of Machine Translation Output”等。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问