Silent Signals, Loud Impact: LLMs for Word-Sense Disambiguation of Coded Dog Whistles

简介

本文介绍了一种编码通信形式——“狗哨”，它对特定受众传递了一层次的含义，并经常被用于种族和社会经济歧视。狗哨起源于美国政治，但近年来已在社交媒体上生根发芽，成为逃避仇恨言论检测系统和保持合理否认的手段。本文提出了一种利用大型语言模型（LLMs）进行狗哨词义消歧的方法，并利用这种技术创建了一个数据集，包含了16,550个高置信度编码示例，这些编码示例用于正式和非正式的通信。《无声信号》是最大的狗哨使用消歧数据集，用于仇恨言论检测、新词研究和政治科学等应用。数据集可在以下网址中找到：https://huggingface.co/datasets/SALT-NLP/silent_signals。
图表
解决问题

本文旨在使用大型语言模型（LLMs）解决狗哨的词义消歧问题，并利用该技术创建一个高置信度的狗哨编码示例数据集，以应用于仇恨言论检测、新词生成和政治科学等领域。
关键思路

本文提出使用大型语言模型对狗哨进行词义消歧，从而创建一个高置信度的狗哨编码示例数据集，为仇恨言论检测、新词生成和政治科学等领域提供帮助。
其它亮点

本文创建了一个名为Silent Signals的大型数据集，其中包括了16,550个高置信度的狗哨编码示例，可用于仇恨言论检测、新词生成和政治科学等领域。本文使用了大型语言模型对狗哨进行了词义消歧，并利用社交媒体等平台上的狗哨使用情况，实现了狗哨的自动检测。本文的实验表明，使用大型语言模型对狗哨进行词义消歧可以有效地提高狗哨检测的准确率。
相关研究

在狗哨检测方面，之前的研究主要是基于规则或者手工特征，而本文提出了使用大型语言模型对狗哨进行词义消歧的新方法。同时，本文还借助社交媒体等平台上的狗哨使用情况，实现了狗哨的自动检测。相关的研究包括《A Survey of Hate Speech Detection Methods》、《Automated Hate Speech Detection and the Problem of Offensive Language》等。

Silent Signals, Loud Impact: LLMs for Word-Sense Disambiguation of Coded Dog Whistles

评论