SGSum(Sports Game Summarization)是一个大规模人工清洗的中文体育赛事摘要数据集。本数据集来源于新浪体育在线(http://match.sports.sina.com.cn/index.html) 中2012年至2020年期间的足球比赛数据,包含了7854场足球比赛的在线评论文本与对应新闻报道,其中每场新闻报道都经过了严格的人工清洗流程。该数据集的提出能够为体育赛事摘要的研究提供数据支持。
OpenKG地址:http://openkg.cn/dataset/sgsum
GitHub:https://github.com/krystalan/SGSum
开放许可协议:CC BY-SA 4.0 (署名相似共享)
贡献者:苏州大学(王佳安、张汀依、瞿剑峰、李直旭),科大讯飞(陈志刚),安徽淘云(刘庆升)
论文链接:https://wangjiaan.cn/files/SGSum.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢