Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation

简介

最大后验概率解码是神经机器翻译中常用的方法，旨在最大化估计的后验概率。然而，高估计概率并不总是导致高翻译质量。最小贝叶斯风险解码提供了一种替代方法，通过寻找具有最高期望效用的假设来实现。在本文中，我们表明，质量估计（QE）重排序，使用QE模型作为重排序器，可以视为MBR的一种变体。受此启发，我们提出了基于源的MBR（sMBR）解码，这是一种利用由反向翻译生成的合成源作为“支持假设”的新方法，并使用无参考质量估计度量作为效用函数，这是首个仅使用源的MBR解码工作。实验表明，sMBR显著优于QE重排序，并与标准MBR解码竞争。此外，与MBR相比，sMBR调用效用函数的次数更少。我们的研究结果表明，sMBR是一种有前途的高质量NMT解码方法。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在提高神经机器翻译的质量，探索最小贝叶斯风险解码的新方法。
关键思路

论文提出了一种新的源基最小贝叶斯风险解码方法，利用由反向翻译生成的合成源作为支持假设，并使用无参考质量评估度量作为效用函数。
其它亮点

论文提出的sMBR方法在实验中表现出比QE reranking更好的性能，并且与标准MBR解码相媲美。该方法还能够减少调用效用函数的次数。论文使用了多个数据集，并开源了代码。
相关研究

最近的相关研究包括：1.基于句子级别的最小风险训练；2.使用神经网络进行质量评估；3.使用多样性方法提高翻译质量。

Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation

提问交流

提问交流