SGHateCheck: Functional Tests for Detecting Hate Speech in Low-Resource Languages of Singapore

2024年05月03日
  • 简介
    为了解决当前仇恨言论检测模型的局限性,我们引入了\textsf{SGHateCheck},这是一个专门为新加坡和东南亚的语言和文化背景设计的新框架。它扩展了HateCheck和MHC的功能测试方法,利用大型语言模型进行翻译和改写,以适应新加坡主要语言的特点,并通过本地注释人员进行细化。\textsf{SGHateCheck}揭示了现有最先进模型的关键缺陷,强调了它们在敏感内容审核方面的不足。本研究旨在促进更有效的仇恨言论检测工具的开发,特别是针对新加坡和东南亚的语言环境。
  • 图表
  • 解决问题
    本论文旨在解决当前仇恨言论检测模型的局限性,特别是针对新加坡和东南亚的语言和文化背景。作者提出了一个新的框架,名为SGHateCheck,旨在扩展HateCheck和MHC的功能测试方法,使用大型语言模型进行翻译和改写,并通过本地标注者进行细化,以更好地适应新加坡和东南亚的语言环境。该工作旨在促进针对多样化语言环境的更有效的仇恨言论检测工具的开发,特别是针对新加坡和东南亚的语言环境。
  • 关键思路
    SGHateCheck框架是本论文的关键思路,它扩展了HateCheck和MHC的功能测试方法,使用大型语言模型进行翻译和改写,并通过本地标注者进行细化,以更好地适应新加坡和东南亚的语言环境。这是一个新颖的解决方案,旨在提高仇恨言论检测的准确性和适用性。
  • 其它亮点
    本论文通过对新加坡和东南亚语言环境的研究,揭示了当前仇恨言论检测模型的严重缺陷,并提出了一个新的解决方案。作者使用了大量的数据集和实验,包括使用大型语言模型进行翻译和改写,并通过本地标注者进行细化。此外,作者还开源了SGHateCheck框架的代码,为后续的研究提供了便利。值得进一步研究的是如何将该框架应用于其他多语言环境中。
  • 相关研究
    在这个领域中,最近的相关研究包括:1. HateCheck: A Benchmark for Evaluating Hate Speech Detection in Arabic (ACL 2020); 2. Multilingual and Code-Switched Hate Speech Detection: A Comparative Study (EMNLP 2020); 3. A Survey on Hate Speech Detection using Natural Language Processing (IEEE 2021).
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论