- 简介仇视女性情绪常常通过比喻语言表达。有些中性词汇在作为贬义词时会带有负面含义。澄清这些词汇的含义可以帮助检测仇视女性情绪。为了解决这个问题,我们介绍了PejorativITy,这是一个新的语料库,包含了1,200条手动注释的意大利推文,用于词级贬义语言和句子级仇视女性情绪的检测。我们评估了将澄清词汇信息注入针对仇视女性情绪检测的模型的影响。具体而言,我们探索了两种不同的注入方法:连接贬义信息和用明确的词汇替换模棱两可的词汇。我们的实验结果,无论是在我们的语料库上还是在两个流行的意大利推文基准测试上,都显示这两种方法都可以显著提高分类效果,表明词义消歧是检测仇视女性情绪的有前途的初步步骤。此外,我们通过上下文词嵌入分析和提示,研究了LLMs对贬义词汇的理解。
- 图表
- 解决问题本文旨在解决在意大利推特上检测贬损性语言和厌恶言论的问题,通过消除模糊性词汇的歧义性来提高模型的分类性能。
- 关键思路本文提出了PejorativITy语料库,其中包含1,200个手动注释的意大利推文,用于词级别的贬损性语言和句子级别的厌恶言论的检测。作者探索了两种注入消歧信息的方法:连接贬损信息和用明确的术语替换模糊的词语。实验证明,这两种方法都可以提高模型的分类性能,表明词义消歧是厌恶言论检测的一个有前途的预处理步骤。
- 其它亮点本文提出了PejorativITy语料库,用于意大利推特上的贬损性语言和厌恶言论检测。作者探索了两种注入消歧信息的方法,并在两个流行的意大利推特基准测试上进行了实验。实验结果表明,这两种方法都可以提高模型的分类性能。此外,作者还通过上下文词向量分析和提示来研究了LLMs对贬损性词汇的理解。
- 最近的相关研究包括:“A Survey on Hate Speech Detection using Natural Language Processing”和“Hate Speech Detection: A Solved Problem? The Challenging Case of Long Tail on Social Media”。
沙发等你来抢
去评论
评论
沙发等你来抢