- 简介本文介绍了我们在TREC实时Twitter摘要中的方法。我们专注于实时推送通知场景,这需要一个系统监视采样推文流并返回与给定兴趣配置文件相关且新颖的推文。我们使用具有极少平滑的Dirichlet评分(基线)来分类推文是否与给定兴趣配置文件相关。使用包括平均精度(MAP)、累积增益(CG)和折扣累积增益(DCG)在内的指标,实验表明我们的方法具有良好的性能。此外,我们还希望从推送队列中删除冗余推文。由于精度限制,我们仅在本文中描述了算法。
- 图表
- 解决问题本篇论文旨在解决TREC实时推特摘要问题,即如何监控推特流并返回与给定兴趣相关且新颖的推特,同时需要从推送队列中删除冗余推特。这是一个新问题。
- 关键思路论文采用Dirichlet分数作为分类器,用于确定推特是否与给定兴趣相关,同时通过MAP、CG和DCG等指标评估性能。算法的关键思路是使用Dirichlet分数进行分类,该方法相对于当前领域的研究具有一定的新意。
- 其它亮点论文实验表明,该方法具有良好的性能,但由于精度限制,仅描述了算法。论文使用的数据集是TREC实时推特摘要数据集,但未提及是否有开源代码。值得深入研究的工作包括如何进一步提高精度和减少冗余推特的数量。
- 最近在这个领域中,还有一些相关研究,如《Real-Time Summarization of Scheduled Events on Twitter》和《Real-Time Event Tracking on Twitter》等。
沙发等你来抢
去评论
评论
沙发等你来抢