- 简介本文提供了一个数据集,包含了4011个关于麻疹疫情的视频数据,这些视频数据发布于2024年1月1日至5月31日间互联网上的264个网站。该数据集可在https://dx.doi.org/10.21227/40s8-xf63 上获取。这些网站主要包括YouTube和TikTok,分别占视频的48.6%和15.2%。其余的网站包括Instagram和Facebook以及各种全球和本地新闻组织的网站。对于这些视频,数据集分别列出了视频的URL、帖子的标题、帖子的描述和视频发布的日期。在开发完这个数据集后,对视频标题和视频描述进行了情感分析(使用VADER)、主观性分析(使用TextBlob)和细粒度情感分析(使用DistilRoBERTa-base)。这包括将每个视频标题和视频描述分类为(i)情感类别之一,即积极、消极或中性,(ii)主观性类别之一,即高度主观、中性主观或最不主观,以及(iii)细粒度情感类别之一,即恐惧、惊讶、喜悦、悲伤、愤怒、厌恶或中性。这些结果作为数据集的独立属性呈现,用于训练和测试机器学习算法,以进行情感分析或主观性分析,以及其他应用。最后,本文还提供了一个开放的研究问题清单,可以使用该数据集进行研究。
- 图表
- 解决问题本论文旨在提供一个关于麻疹爆发的数据集,并进行情感分析和主观性分析,以供机器学习算法进行训练和其他应用。
- 关键思路论文的关键思路是收集关于麻疹爆发的视频数据,并进行情感分析和主观性分析,以提供一个用于机器学习算法训练的数据集。
- 其它亮点论文使用了VADER、TextBlob和DistilRoBERTa-base进行情感分析和主观性分析,并将结果作为数据集的属性。论文还提供了一些开放性研究问题。
- 最近的相关研究包括:1. “Social media and vaccine hesitancy: new updates for the era of COVID-19 and globalized infectious diseases”;2. “Measuring vaccine hesitancy: Field testing a WHO survey tool in the Pacific Islands”;3. “A systematic review of the factors affecting vaccine hesitancy and acceptance”
沙发等你来抢
去评论
评论
沙发等你来抢