- 简介社交媒体的广泛使用导致了自动分析公众舆论的方法越来越受欢迎。监督学习方法擅长文本分类,但社交媒体讨论的动态性使得这些技术面临不断变化的挑战。另一方面,传统的无监督方法,如主题建模,通常揭示了全面的模式,可能无法捕捉特定的细微差别。因此,社交媒体话语研究的大部分仍然依赖于费时费力的手动编码技术和人在环节方法。在这项工作中,我们研究了发现与特定主题相关的论点的问题。我们提出了一种通用的LLMs-in-the-Loop策略,利用大型语言模型(LLMs)的先进能力从社交媒体消息中提取潜在的论点。为了证明我们的方法,我们将我们的框架应用于有争议的话题。我们使用了两个公开可用的数据集:(1)包含25个主题的14k个Facebook广告的气候宣传数据集和(2)包含14个主题的9k个Facebook广告的COVID-19疫苗宣传数据集。此外,我们设计了一个下游任务,利用气候辩论中的论点来进行立场预测。此外,我们还分析了人口统计学定向和基于现实世界事件的消息适应。
- 图表
- 解决问题本论文旨在解决社交媒体舆论分析中的自动化问题,提出了一种基于大语言模型的策略来从社交媒体消息中提取潜在的论点。同时,论文还探讨了如何应用这种方法来预测立场、分析人口统计学定向和消息的实时调整。
- 关键思路论文提出了一种基于大语言模型的策略来自动提取社交媒体消息中的潜在论点,进而解决社交媒体舆论分析中的自动化问题。
- 其它亮点论文使用两个公开数据集来演示其方法的有效性,并设计了一个下游任务来预测立场。同时,论文还分析了人口统计学定向和消息的实时调整,并提供了开源代码。值得进一步研究的是,如何进一步提高潜在论点的准确性和有效性。
- 在最近的相关研究中,有一些研究探讨了使用大语言模型来分析社交媒体数据,如《GPT-2 for Automatic Text Summarization on Social Media》和《BERT for Social Media Text Classification: A Comparative Study》。
沙发等你来抢
去评论
评论
沙发等你来抢