Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation

2024年06月17日
  • 简介
    最大后验概率解码是神经机器翻译中常用的方法,旨在最大化估计的后验概率。然而,高估计概率并不总是导致高翻译质量。最小贝叶斯风险解码提供了一种替代方法,通过寻找具有最高期望效用的假设来实现。在本文中,我们表明,质量估计(QE)重排序,使用QE模型作为重排序器,可以视为MBR的一种变体。受此启发,我们提出了基于源的MBR(sMBR)解码,这是一种利用由反向翻译生成的合成源作为“支持假设”的新方法,并使用无参考质量估计度量作为效用函数,这是首个仅使用源的MBR解码工作。实验表明,sMBR显著优于QE重排序,并与标准MBR解码竞争。此外,与MBR相比,sMBR调用效用函数的次数更少。我们的研究结果表明,sMBR是一种有前途的高质量NMT解码方法。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在提高神经机器翻译的质量,探索最小贝叶斯风险解码的新方法。
  • 关键思路
    论文提出了一种新的源基最小贝叶斯风险解码方法,利用由反向翻译生成的合成源作为支持假设,并使用无参考质量评估度量作为效用函数。
  • 其它亮点
    论文提出的sMBR方法在实验中表现出比QE reranking更好的性能,并且与标准MBR解码相媲美。该方法还能够减少调用效用函数的次数。论文使用了多个数据集,并开源了代码。
  • 相关研究
    最近的相关研究包括:1.基于句子级别的最小风险训练;2.使用神经网络进行质量评估;3.使用多样性方法提高翻译质量。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问