- 简介双语词典归纳是一项学习单词翻译而无需双语平行语料库的任务。我们将此任务建模为矩阵补全问题,并提出了一个有效且可扩展的框架来完成矩阵补全。该方法利用多样的双语和单语信号,每个信号可能是不完整或有噪音的。我们的模型在高资源语言和低资源语言方面均实现了最先进的性能。
-
- 图表
- 解决问题本论文的问题是如何在没有双语平行语料库的情况下学习单词翻译。这是否是一个新问题?
- 关键思路本论文将这个问题建模为矩阵完成问题,并提出了一个有效且可扩展的框架来完成矩阵。该方法利用多种双语和单语信号,每种信号都可能不完整或有噪声。
- 其它亮点本论文的模型在高资源和低资源语言方面均取得了最先进的性能。实验设计了多种数据集,包括一些开源数据集,并且提供了开源代码。该方法可以进一步扩展用于其他任务。
- 最近的相关研究包括使用神经网络和深度学习模型来解决双语词汇识别问题。例如,可以参考以下论文:《Bilingual Word Embeddings for Phrase-Based Machine Translation》、《Unsupervised Bilingual Word Embedding with Very Sparse Data》。


提问交流