- 简介我们介绍了PoPreRo,这是来自Reddit的罗马尼亚帖子流行度预测的第一个数据集。PoPreRo数据集包括来自罗马尼亚五个不同子论坛的帖子样本,共计28,107个数据样本。除了我们的新数据集外,我们还介绍了一组竞争模型,可用作未来研究的基准。有趣的是,最高得分模型在测试集上实现了61.35%的准确率和60.60%的宏F1分数,表明PoPreRo上的流行度预测任务非常具有挑战性。基于少量提示Falcon-7B大型语言模型的进一步研究也指向同一方向。因此,我们认为PoPreRo是一个有价值的资源,可用于评估模型在预测罗马尼亚社交媒体帖子的流行度方面的表现。我们在https://github.com/ana-rogoz/PoPreRo上发布我们的数据集。
- 图表
- 解决问题本论文旨在解决预测罗马尼亚Reddit帖子受欢迎程度的问题,并提供一个新的数据集PoPreRo。作者还试图探讨使用Falcon-7B大型语言模型进行少量样本提示的效果。
- 关键思路本文的关键思路是使用机器学习模型对罗马尼亚Reddit帖子的文本特征进行建模,以预测帖子的受欢迎程度。此外,作者还使用Falcon-7B大型语言模型进行少量样本提示,以探索其在该任务上的效果。
- 其它亮点本文提供了一个新的数据集PoPreRo,并介绍了一组竞争模型作为未来研究的基线。最高得分的模型在测试集上的准确度为61.35%,宏F1分数为60.60%,表明PoPreRo上的受欢迎程度预测任务非常具有挑战性。此外,作者还探讨了使用Falcon-7B大型语言模型进行少量样本提示的效果。
- 最近在这个领域中,还有一些相关研究,如Predicting Popularity of Social Media Posts Using Multimodal Features and Deep Learning、Predicting Popularity of News Articles Using Transfer Learning和A Survey on Predicting the Popularity of Web Content等。
沙发等你来抢
去评论
评论
沙发等你来抢