- 简介最大后验概率解码是神经机器翻译中常用的方法,旨在最大化估计的后验概率。然而,高估计概率并不总是导致高翻译质量。最小贝叶斯风险解码提供了一种替代方法,通过寻找具有最高期望效用的假设来实现。在本文中,我们表明,质量估计(QE)重排序,使用QE模型作为重排序器,可以视为MBR的一种变体。受此启发,我们提出了基于源的MBR(sMBR)解码,这是一种利用由反向翻译生成的合成源作为“支持假设”的新方法,并使用无参考质量估计度量作为效用函数,这是首个仅使用源的MBR解码工作。实验表明,sMBR显著优于QE重排序,并与标准MBR解码竞争。此外,与MBR相比,sMBR调用效用函数的次数更少。我们的研究结果表明,sMBR是一种有前途的高质量NMT解码方法。
-
- 图表
- 解决问题论文旨在提高神经机器翻译的质量,探索最小贝叶斯风险解码的新方法。
- 关键思路论文提出了一种新的源基最小贝叶斯风险解码方法,利用由反向翻译生成的合成源作为支持假设,并使用无参考质量评估度量作为效用函数。
- 其它亮点论文提出的sMBR方法在实验中表现出比QE reranking更好的性能,并且与标准MBR解码相媲美。该方法还能够减少调用效用函数的次数。论文使用了多个数据集,并开源了代码。
- 最近的相关研究包括:1.基于句子级别的最小风险训练;2.使用神经网络进行质量评估;3.使用多样性方法提高翻译质量。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流