- 简介Discord 已从一个专注于游戏的通讯工具发展成为一个支持多样化在线社区的多功能平台。尽管它拥有庞大的用户基础和活跃的公共服务器,但由于数据获取的挑战,学术界对 Discord 的研究仍然有限。本文介绍了 Discord Unveiled:一个涵盖公共通信的综合数据集(2015-2024),这是迄今为止最全面的 Discord 公共服务器数据。该数据集包含来自 3,167 个公共服务器的 474 万用户的超过 20.5 亿条消息,约占 Discord 发现功能中列出服务器的 10%。从 Discord 于 2015 年推出到 2024 年底,该数据集提供了一个强大的时间框架和主题框架,可用于分析去中心化管理、社区治理、信息传播和社会动态。数据是通过 Discord 的公共 API 收集的,并通过匿名技术遵守伦理准则和隐私标准。该数据集被组织成结构化的 JSON 文件,便于与计算社会科学方法无缝集成。初步分析揭示了用户参与度、机器人使用率和语言多样性方面的显著趋势,其中英语占据主导地位,西班牙语、法语和葡萄牙语也有相当大的代表性。此外,如社交、艺术、音乐和梗图等流行社区主题也突显了 Discord 已经超越了其游戏起源的扩展。
- 图表
- 解决问题该论文试图解决的问题是,由于数据访问的挑战,学术界对Discord这一拥有庞大用户基础和活跃公共服务器的平台的研究仍然有限。它旨在通过提供一个全面的数据集来促进对Decord上公共交流的研究。
- 关键思路关键思路在于创建并发布了名为'Discord Unveiled'的数据集,这是迄今为止最广泛的Discord公共服务器数据集合。与当前领域研究相比,此数据集不仅规模巨大(超过20.5亿条消息),而且涵盖了从2015年到2024年的长期时间跨度,为分析社区治理、信息传播和社会动态提供了坚实的基础。
- 其它亮点其他值得关注的地方包括: 1. 数据集包含来自3,167个公共服务器的消息,代表了大约10%的Discord Discovery列表中的服务器。 2. 初步分析揭示了用户参与度、机器人使用情况以及语言多样性等显著趋势。 3. 社区主题如社交、艺术、音乐和模因表明Discord已超越其游戏起源,变得更加多元化。 4. 数据收集严格遵守伦理指南,并采用了匿名技术以保护隐私。 5. 数据集以结构化的JSON文件形式组织,便于与计算社会科学方法集成。
- 最近在这个领域中,还有以下相关研究被进行: 1. 'Analyzing Online Communities: A Study of Reddit and Its Impact on Mental Health' 2. 'The Evolution of Social Media Platforms: From Facebook to Emerging Networks' 3. 'Understanding User Behavior in Multiplayer Online Games through Chat Logs' 4. 'Privacy and Security Challenges in Large-Scale Data Collection from Social Platforms' 这些研究探讨了在线社区的行为模式、社交网络的发展、游戏聊天记录中的用户行为以及大规模数据收集中的隐私和安全问题。
沙发等你来抢
去评论
评论
沙发等你来抢