KpopMT: Translation Dataset with Terminology for Kpop Fandom

2024年07月10日
  • 简介
    机器学习依赖于现有的语料库,而人类具有独特的能力,能够建立和接受新的语言系统。这使得人类能够在社交群体中形成独特的语言系统。基于这一点,我们关注在社交群体内解决翻译难题方面存在的差距,其中群体内的成员使用独特的术语。我们提出了 KpopMT 数据集,旨在通过启用精确的术语翻译来填补这一差距,选择 Kpop 粉丝群体作为社交群体的初始倡议,因为它在全球范围内非常受欢迎。专业翻译人员为韩国帖子和评论提供了1k个英文翻译,每个都注释了社交群体语言系统中的具体术语。我们评估了包括GPT模型在内的现有翻译系统在KpopMT上的表现,以确定它们的失败情况。结果显示总体得分较低,强调了在翻译中反映群体特定的术语和风格所面临的挑战。我们公开了KpopMT数据集。
  • 图表
  • 解决问题
    解决社交群体中特定术语翻译的挑战
  • 关键思路
    创建KpopMT数据集,使用专家翻译员提供针对Kpop fandom的英文翻译,注释了社交群体中的特定术语,评估现有的翻译系统,发现其在反映群体特定术语和风格方面的挑战
  • 其它亮点
    KpopMT数据集公开可用,实验结果表明现有翻译系统在反映群体特定术语和风格方面存在挑战,需要进一步研究
  • 相关研究
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论