SGSum(Sports Game Summarization)是一个大规模人工清洗的中文体育赛事摘要数据集。本数据集来源于新浪体育在线(http://match.sports.sina.com.cn/index.html) 中2012年至2020年期间的足球比赛数据,包含了7854场足球比赛的在线评论文本与对应新闻报道,其中每场新闻报道都经过了严格的人工清洗流程。该数据集的提出能够为体育赛事摘要的研究提供数据支持。

数据集地址:https://github.com/krystalan/SGSum

论文地址:https://wangjiaan.cn/files/SGSum.pdf

相关介绍:

资源发布 | 体育赛事摘要生成数据集SGSUM:助力体育赛事新闻稿的自动撰写

开源开放 | 高质量体育赛事摘要数据集SGSum(CCKS2021)