Cyber Risks of Machine Translation Critical Errors : Arabic Mental Health Tweets as a Case Study

2024年05月19日
  • 简介
    随着神经机器翻译(NMT)系统的出现,机器翻译的输出已经达到了前所未有的准确水平,这导致几乎所有具有多语言内容的在线平台都普及了机器翻译工具。然而,像其他最先进的AI生成系统一样,NMT系统容易出现机器幻觉错误。NMT幻觉的问题在于它们是非常流畅的幻觉。由于它们被训练为产生语法正确的话语,因此NMT系统能够产生过于流畅以至于无法被机器翻译工具的用户和自动质量度量所识别的误译。在本文中,我们介绍了一个真实的机器翻译关键错误数据集,以指出MT的常见使用所涉及的道德和安全问题。该数据集包括手动注释的阿拉伯心理健康帖子的误译和关键错误类型。我们还展示了常用的质量度量不惩罚关键错误,并将其作为值得研究人员进一步关注的关键问题。
  • 作者讲解
  • 图表
  • 解决问题
    探讨机器翻译的错误类型及其对伦理和安全问题的影响,提出了机器翻译严重错误的数据集,并指出当前常用的质量评估指标不能惩罚这些错误。
  • 关键思路
    通过手动注释阿拉伯语心理健康帖子的机器翻译错误类型,展示机器翻译中的严重错误类型,指出当前常用的质量评估指标无法惩罚这些错误,需要更多的研究关注这一问题。
  • 其它亮点
    论文提出了一个新的机器翻译严重错误的数据集,展示了常用的质量评估指标不能惩罚这些错误的问题,需要更多的研究关注这一问题。实验使用了手动注释的阿拉伯语心理健康帖子的机器翻译错误类型,未提供开源代码。
  • 相关研究
    最近的相关研究包括《Assessing the Ability of LSTMs to Learn Syntax-Sensitive Dependencies》、《Attention is All You Need》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问