Exploiting Hatred by Targets for Hate Speech Detection on Vietnamese Social Media Texts

2024年04月30日
  • 简介
    社交网络的增长使得有害内容迅速传播。检测仇恨言论是一项旨在减少有害评论数量的任务。由于用户创造的仇恨言论多种多样,因此除了检测外,解释仇恨言论也是必要的。因此,我们提出了一种方法来构建一个系统,用于从社交媒体的在线流文本中检测有针对性的仇恨言论。我们首先介绍了ViTHSD——一种用于越南社交媒体文本的有针对性仇恨言论检测数据集。该数据集包含10,000条评论,每条评论都被标记为特定的目标,并分为三个级别:干净的、冒犯的和仇恨的。数据集中有5个目标,每个目标都由人类手动进行了严格的注释指南标记相应的级别。从数据集中获得的注释者间一致性为0.45,这被认为是中等水平的,使用Cohen's Kappa指数进行了指示。然后,我们通过将Bi-GRU-LSTM-CNN与预训练语言模型相结合来构建了这个任务的基线,以利用BERTology的文本表示能力。最后,我们建议一种方法,将有针对性的仇恨言论检测的基线模型集成到在线流系统中,以在社交媒体上预防令人讨厌和冒犯的内容。
  • 图表
  • 解决问题
    提出了一种针对越南社交媒体文本的有针对性仇恨言论检测系统的方法,旨在减少有害评论的数量。
  • 关键思路
    结合Bi-GRU-LSTM-CNN和预训练语言模型BERTology构建了针对有害评论的基线模型,并提出了将其整合到在线流系统中的方法。
  • 其它亮点
    提出了ViTHSD数据集,包含10K条评论,每条评论都被标记为特定目标的三个级别:清洁、冒犯和仇恨。数据集的五个目标分别由人手动标记,并通过Cohen's Kappa指数获得了0.45的一致性。实验结果表明,提出的基线模型在ViTHSD数据集上取得了最佳性能。
  • 相关研究
    在类似的领域中,也有一些相关研究,例如:1. “Detecting Hate Speech in Social Media Using a Hybrid Approach”;2. “A Survey of Hate Speech Detection Methods”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论