- 简介我们介绍了PoPreRo,这是来自Reddit的罗马尼亚帖子流行度预测的第一个数据集。PoPreRo数据集包括来自罗马尼亚五个不同子论坛的帖子样本,共计28,107个数据样本。除了我们的新数据集外,我们还介绍了一组竞争模型,可用作未来研究的基准。有趣的是,最高得分模型在测试集上实现了61.35%的准确率和60.60%的宏F1分数,表明PoPreRo上的流行度预测任务非常具有挑战性。基于少量提示Falcon-7B大型语言模型的进一步研究也指向同一方向。因此,我们认为PoPreRo是一个有价值的资源,可用于评估模型在预测罗马尼亚社交媒体帖子的流行度方面的表现。我们在https://github.com/ana-rogoz/PoPreRo上发布我们的数据集。
-
- 图表
- 解决问题本论文旨在解决预测罗马尼亚Reddit帖子受欢迎程度的问题,并提供一个新的数据集PoPreRo。作者还试图探讨使用Falcon-7B大型语言模型进行少量样本提示的效果。
- 关键思路本文的关键思路是使用机器学习模型对罗马尼亚Reddit帖子的文本特征进行建模,以预测帖子的受欢迎程度。此外,作者还使用Falcon-7B大型语言模型进行少量样本提示,以探索其在该任务上的效果。
- 其它亮点本文提供了一个新的数据集PoPreRo,并介绍了一组竞争模型作为未来研究的基线。最高得分的模型在测试集上的准确度为61.35%,宏F1分数为60.60%,表明PoPreRo上的受欢迎程度预测任务非常具有挑战性。此外,作者还探讨了使用Falcon-7B大型语言模型进行少量样本提示的效果。
- 最近在这个领域中,还有一些相关研究,如Predicting Popularity of Social Media Posts Using Multimodal Features and Deep Learning、Predicting Popularity of News Articles Using Transfer Learning和A Survey on Predicting the Popularity of Web Content等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流