Improving Vietnamese-English Medical Machine Translation

2024年03月28日
  • 简介
    这篇论文介绍了MedEV,一个专门用于医学领域的高质量越南语-英语平行数据集,包括约36万个句对。机器翻译在医学领域的越南语-英语翻译仍然是一个未被充分探索的研究领域。我们在这个新的MedEV数据集上进行了广泛的实验,比较了Google翻译、ChatGPT(gpt-3.5-turbo)、最先进的越南语-英语神经机器翻译模型和预训练的双语/多语序列到序列模型。实验结果表明,针对每个翻译方向微调“vinai-translate”可以获得最佳性能。我们公开发布我们的数据集以促进进一步的研究。
  • 作者讲解
  • 图表
  • 解决问题
    这篇论文的问题是为医学领域的越南语-英语机器翻译提供高质量的平行数据集,以促进该领域的研究。
  • 关键思路
    论文的关键思路是使用fine-tuning技术对“vinai-translate”模型进行优化,以提高越南语-英语机器翻译的性能。
  • 其它亮点
    论文介绍了MedEV数据集,该数据集包含约360K个医学领域的越南语-英语句子对,作者进行了大量实验比较了不同机器翻译模型在该数据集上的表现,实验结果表明fine-tuning技术可以显著提高机器翻译的性能。作者公开了数据集以促进进一步的研究。
  • 相关研究
    最近的相关研究包括《A survey of machine translation: its history, current status, and future prospects》和《Neural Machine Translation of Rare Words with Subword Units》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问