Hostile Counterspeech Drives Users From Hate Subreddits

向作者提问

NEW

简介

反言论（Counterspeech）——即反对仇恨言论的言论——最近作为减少社交媒体上仇恨的策略而备受关注。虽然以前的研究表明反言论可以在一定程度上减少仇恨言论，但我们对其对在线仇恨社区参与的影响及哪些反言论策略可以减少有害行为知之甚少。本文通过识别 Reddit 中的 25 个大型仇恨社区（“subreddits”），并分析反言论对这些社区中新手的影响，开始填补这些空白。我们首先构建了一个新的公共数据集，其中包含这些子社区内经过精心注释的反言论和非反言论评论。我们使用这个数据集来训练一个最先进的反言论检测模型。接下来，我们使用匹配方法来评估敌对和非敌对反言论对新手在仇恨子社区中参与的因果效应。我们发现，虽然非敌对反言论无法阻止用户完全退出这些仇恨子社区，但一条敌对反言论评论会大大降低未来参与的可能性。虽然这些结果为理解反言论的功效提供了细节，但这些结果有两个问题未解决：一是敌对反言论是否会阻止新手参与整个网络上的仇恨，还是只会将他们推向更不受管理和更极端的仇恨社区；二是提出了关于敌对反言论的伦理考虑，因为敌对反言论相对普遍，可能会加剧而不是缓解社会的敌对水平。这些发现强调了未来工作改进反言论策略并最小化意外伤害的重要性。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

研究Counterspeech策略对社交媒体上仇恨言论的影响，特别是对新加入仇恨社区的用户的影响。
关键思路

使用Reddit上25个大型仇恨社区的数据集，训练一个最先进的Counterspeech检测模型，通过匹配评估Counterspeech对新用户在仇恨社区的参与程度的因果效应。发现非敌对性的Counterspeech无法阻止用户完全退出仇恨社区，而单个敌对性Counterspeech评论会大幅降低用户未来参与的可能性。
其它亮点

论文使用了Reddit上25个大型仇恨社区的数据集，构建了一个新的公共数据集，用于Counterspeech和非Counterspeech评论的注释，训练了一个最先进的Counterspeech检测模型。研究发现，敌对性的Counterspeech比非敌对性的Counterspeech更为常见，但可能会加剧社会的敌对情绪。
相关研究

最近的相关研究包括： 1. "Counterspeech Effectiveness on Social Media: A Systematic Literature Review" by A. Basu, et al. 2. "The Effectiveness of Counter-Narratives in Countering Extremist Messaging" by J. Horgan, et al. 3. "Attenuating Online Hate: The Effectiveness of Counterspeech" by D. Garcia, et al.

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问