Visualization of Unstructured Sports Data -- An Example of Cricket Short Text Commentary

2024年03月22日
  • 简介
    体育可视化侧重于使用结构化数据,例如比分数据和追踪数据。与体育相关的非结构化数据源可在博客、社交媒体帖子和在线新闻文章等各个地方找到。体育可视化方法要么未充分利用这些来源中的信息,要么通过使用这些来源提出的可视化方法并未增加到体育可视化方法的体系中。我们提出使用非结构化数据,即板球短文本评论进行可视化。短文本评论数据用于构建个人球员的实力规则和弱点规则。提出了球员实力规则和弱点规则的计算可行定义。介绍了构建规则的可视化方法。此外,计算并可视化具有相似实力规则或弱点规则的球员。我们通过分析超过一百万个文本评论来演示短文本评论在可视化中的有用性,以分析板球运动员的优势和劣势。我们通过两种验证方法验证了构建的规则。收集的数据、源代码和针对超过500名球员的获得结果均已公开发布。
  • 图表
  • 解决问题
    利用非结构化数据进行运动可视化的研究,探索运用短文本评论数据进行构建运动员实力规则和弱点规则,并进行可视化的方法。
  • 关键思路
    利用短文本评论数据构建运动员实力规则和弱点规则,并进行可视化展示。通过计算相似性,将实力规则或弱点规则相似的球员进行聚类,进行可视化呈现。提出了可计算的运动员实力规则和弱点规则的定义。
  • 其它亮点
    论文使用了超过一百万条短文本评论数据进行实验,将结果公开可用。通过两种验证方法对构建的规则进行了验证。论文提出的方法相比当前领域的研究具有创新性。
  • 相关研究
    在该领域的相关研究中,一些论文标题包括:《基于数据挖掘技术的足球比赛数据分析》、《基于机器学习的篮球比赛数据分析》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论