德国汉堡大学 | 电影有多可恨?电影字幕的研究与预测
作者:Niklas von Boguszewski, Sana Moin, Anirban Bhowmick, Seid Muhie Yimam, Chris Biemann
推荐理由:利用预训练模型在电影字幕数据的情感分类应用
简介:作者研究了电影中仇恨言论的检测技术。研究引入了一个新的数据集,该数据集收集了六部电影的字幕,其中每一句话都被标注为仇恨、冒犯或正常。在现有的社交媒体数据集(来自Twitter和福克斯新闻)上应用领域适应和微调的迁移学习技术。作者评估了11k电影字幕上的不同表示,比如词袋(BoW)、双向长短时记忆(Bi-LSTM)和来自Transformer的双向编码器表示(BERT)。其中BERT模型获得了77%的最佳宏观平均F1分数。因此,本研究最终证明了社交媒体领域的迁移学习:可以有效地通过字幕对电影中的仇恨和攻击性言论进行分类。
下载链接:https://arxiv.org/abs/2108.10724
HUB地址:https://hub.baai.ac.cn/view/9461
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢