Instagram 和 Twitter 等社交媒体已成为营销和销售非法药物的重要平台。检测在线非法毒品贩运已成为打击非法毒品在线交易的关键。然而,法律地位往往在空间和时间上有所不同;即使对于同一种药物,联邦和州立法对其合法性也可能有不同的规定。与此同时,更多的贩毒事件被伪装成一种新的广告评论形式,导致信息异质性。因此,从社交媒体准确检测非法贩毒事件 (IDTE) 变得更具挑战性。在这项工作中,我们对 Instagram 上 IDTE 的细粒度检测进行了首次系统研究。我们建议采用深度多模态多标签学习 (DMML) 方法来检测 IDTE,并在新构建的称为多模态 IDTE(MM-IDTE) 的数据集上证明其有效性。具体来说,我们的模型以文本和图像数据作为输入,并结合多模态信息来预测非法药物的多个标签。受 BERT 成功的启发,我们通过联合微调预训练的文本和图像编码器,开发了一种自我监督的多模态双向转换器。我们构建了一个大规模数据集 MM-IDTE,其中手动注释了多个药物标签,以支持对非法药物的细粒度检测。 MM-IDTE 数据集上的大量实验结果表明,即使存在试图逃避检测的特殊字符和样式更改,所提出的 DMML 方法也可以准确检测 IDTE。

内容中包含的图片若涉及版权问题,请及时与我们联系删除