- 简介机器翻译中存在一个问题,即输入中的实体性别模糊不清。为了解决这个问题,已经提出了控制翻译的任务,该任务将模糊实体的性别作为附加输入。然而,大多数现有的工作只考虑了一个目标性别的简化设置。在本文中,我们在具有多个实体的输入的更为现实的情况下解决了控制翻译问题,并提出了针对LLMs的实体性别(GoE)提示方法。我们提出的方法使用细粒度的实体级别性别信息指导模型以正确的性别形态进行翻译。通过利用四个评估基准,我们调查了LLMs在多个维度上的控制翻译能力,并发现LLMs在控制翻译方面达到了最先进的性能。此外,我们发现在控制多个实体的性别时会出现性别干扰现象。最后,我们解决了现有性别准确性评估指标的局限性,并提出利用LLMs作为机器翻译性别形态的评估器的方法。
- 图表
- 解决问题本文解决的问题是在机器翻译中,处理输入中存在性别歧视的实体时的歧义问题。作者提出了一种控制翻译的方法,以处理多个实体的性别歧视问题。
- 关键思路本文提出了Gender-of-Entity(GoE)提示方法,为LLMs提供细粒度的实体级别性别信息,从而实现正确的性别词尾。
- 其它亮点本文通过四个评估基准调查了LLMs在多个维度上的控制翻译能力,并发现当控制多个实体的性别时,会出现性别干扰现象。作者提出了利用LLMs作为机器翻译性别词尾的评估器的方法。
- 最近的相关研究包括:1.《Gender Bias in Neural Machine Translation》;2.《Controllable Text Generation》;3.《Learning to Control the Fine-grained Sentiment for Neural Machine Translation》。
沙发等你来抢
去评论
评论
沙发等你来抢