Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with Wider Topic Analysis

2024年03月04日
  • 简介
    情感分析(SA)一直是一个蓬勃发展的研究领域,但阿拉伯语情感分析(ASA)的任务在研究领域中仍未得到充分重视。本研究提供了对现有ASA文本内容的深入和广泛分析,并确定了它们的共同主题、应用领域、方法、技术和算法。深入研究手动分析了2002年至2020年间在SAGE、IEEE、Springer、WILEY和Google Scholar四个学术数据库上发表的133篇英文ASA论文。广泛研究使用现代自动机器学习技术,如主题建模和时间分析,对2010年至2020年间2297篇ASA出版物进行了加强,以加强先前研究所确定的主题和趋势。主要发现显示ASA使用了不同的方法:机器学习、基于词典的和混合方法。其他发现包括ASA“获胜”的算法(SVM、NB、混合方法)。深度学习方法,如LSTM可以提供更高的准确性,但对于ASA来说,有时语料库不够大。此外,虽然有一些ASA语料库和词典,但需要更多。具体而言,阿拉伯语推文语料库和数据集目前只是中等规模。此外,具有高覆盖率的阿拉伯语词典仅包含现代标准阿拉伯语(MSA)单词,而具有阿拉伯语方言的词典则相当小。因此,需要创建新的语料库。另一方面,ASA工具严重缺乏。需要开发ASA工具,这些工具可以在工业界和学术界中用于阿拉伯文本情感分析。因此,我们的研究提供了有关ASA研究面临的挑战的见解,并提供了推动该领域发展的建议,例如缺乏方言阿拉伯资源、阿拉伯推文、语料库和数据集用于情感分析。
  • 解决问题
    阿拉伯语情感分析的研究相对较少,本文试图深度和广度分析现有的阿拉伯语情感分析研究,识别其共同主题、应用领域、方法、技术和算法等,同时指出该领域的挑战和未来发展方向。
  • 关键思路
    本文通过人工分析和机器学习技术,对133篇英文ASA论文和2297篇开放获取的ASA出版物进行了深入和广泛的研究,发现ASA的不同方法包括机器学习、基于词典的和混合方法等,SVM、NB和混合方法是ASA中表现最好的算法,但是深度学习方法,如LSTM,需要更大的数据集支持。
  • 其它亮点
    本文指出ASA领域需要更多的阿拉伯语数据集和词典,特别是阿拉伯语推文数据集和包含方言的词典,同时需要开发ASA工具,以便在工业和学术界中使用。值得关注的是,本文提供了ASA领域的挑战和未来发展方向,为研究人员提供了指导。
  • 相关研究
    最近的相关研究包括:1.阿拉伯语情感分析的挑战和机遇;2.基于深度学习的阿拉伯语情感分析;3.阿拉伯语情感分析的词典方法比较。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论