- 简介本文提出了一种称为“检索增强神经机器翻译(RAMT)”的架构,该架构从存储器中检索样例以指导生成过程。虽然这一趋势中的大多数作品探索了利用检索样例的新方法,但上游检索步骤大多未被探索。本文研究了几种翻译架构的不同检索方法对其效果的影响,以更好地理解这两个过程之间的相互作用。我们在多领域环境下的两种语言对中进行了实验,并考虑了基于标准自回归模型、基于编辑的模型和具有上下文学习的大型语言模型的几种下游架构。我们的实验表明,检索技术的选择对翻译得分产生影响,不同架构之间存在差异。我们还讨论了增加样例数量和多样性的效果,这在各方面大多数是积极的。
-
- 图表
- 解决问题研究Retrieval-Augmented Neural Machine Translation (RAMT)架构中的上游检索步骤对翻译得分的影响。
- 关键思路通过实验研究不同的检索方法对多个翻译架构的影响,探究上游检索步骤与下游生成过程之间的相互作用。
- 其它亮点实验结果表明,检索技术的选择对翻译得分有影响,并且不同架构之间存在差异。此外,增加检索示例的数量和多样性通常对翻译效果有积极影响。
- 最近的相关研究包括:《Improving Neural Machine Translation with Conditional Sequence Generative Adversarial Nets》、《Learning to Retrieve Reasoning Paths over Wikipedia Graph for Question Answering》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流