- 简介机器翻译中一个重要的挑战是生成高质量和多样化的翻译。以往的研究表明,从机器翻译模型中估算的可能性与翻译质量的相关性很差。相比之下,质量评估指标(如COMET或BLEURT)与人类判断具有很高的相关性,这促使它们被用作重新排序器(如质量感知和最小贝叶斯风险解码)。然而,依赖于单个高质量的翻译结果会增加“操纵指标”的风险。本文解决了采样一组高质量和多样化翻译的问题。我们提供了一种简单有效的方法,通过将它们用作Gibbs分布的能量函数来避免过度依赖于噪声质量估计。我们不是寻找分布中的模式,而是通过Metropolis-Hastings算法(一种简单的马尔可夫链蒙特卡罗方法)从高密度区域生成多个样本。结果表明,我们提出的方法在多种语言对(英语$\leftrightarrow$德语、俄语)和两个强解码器(Alma-7b、Tower-7b)中产生了高质量和多样化的输出。
- 图表
- 解决问题解决问题:论文致力于解决机器翻译中高质量且多样化翻译的问题,避免仅依赖于单一翻译的评估指标。
- 关键思路关键思路:通过使用高质量评估指标作为Gibbs分布的能量函数,并通过Metropolis-Hastings算法从高密度区域生成多个样本,从而实现高质量和多样化的翻译结果。
- 其它亮点亮点:论文使用两个强的解码器LMM(Alma-7b和Tower-7b)在多种语言对(英语和德语,俄语)上进行实验,结果表明所提出的方法能够生成高质量和多样化的输出。此外,论文还使用了COMET和BLEURT等评估指标,并提供了开源代码。
- 相关研究:在机器翻译领域,最近的相关研究包括使用GAN来生成多样化的翻译,以及使用强化学习来优化翻译质量。
沙发等你来抢
去评论
评论
沙发等你来抢