A Syntax-Injected Approach for Faster and More Accurate Sentiment Analysis

2024年06月21日
  • 简介
    情感分析(SA)是自然语言处理(NLP)的一个关键方面,涉及到文本内容中的主观评估。句法分析在SA中非常有用,因为明确的句法信息可以提高准确性并提供解释性,但实践中它往往是计算瓶颈,因为解析算法速度较慢。本文通过使用序列标注句法分析器(SELSP)来注入语法进入SA,以解决该瓶颈。通过将依存分析视为序列标注问题,我们极大地提高了基于语法的SA的速度。 SELSP在三元极性分类任务上进行了训练和评估,证明了与传统解析器(如Stanza)和使用浅层句法规则进行SA的启发式方法(如VADER)相比,在极性预测任务中具有更快的性能和更好的准确性。这种提高的速度和改进的准确性使SELSP特别适用于研究和工业中的SA从业者。此外,我们在SELSP上测试了几个情感词典,以查看哪个词典在极性预测任务中提高了性能。此外,我们将SELSP与在5标签分类任务上进行训练的基于Transformer的模型进行比较。结果表明,捕捉极性判断变化的词典比忽略极性判断变化的词典提供更好的结果。此外,我们展示了SELSP在极性预测任务中比基于Transformer的模型快得多。
  • 图表
  • 解决问题
    本论文的问题是如何在情感分析中注入句法信息以提高准确性和解释性,同时解决句法分析算法速度慢的问题。
  • 关键思路
    本论文的关键思路是使用序列标注句法分析器(SELSP)将依存句法分析视为序列标注问题,以大大提高基于句法的情感分析的速度和准确性。
  • 其它亮点
    本论文使用SELSP在三元极性分类任务上进行训练和评估,证明了其在情感极性预测任务中比传统的解析器(如Stanza)和使用浅层句法规则进行情感分析的启发式方法(如VADER)具有更快的性能和更好的准确性。此外,作者还测试了几个情感词典,并比较了SELSP和基于Transformer的模型在五级分类任务中的表现。实验结果表明,能够捕捉极性判断变化的词典比忽略极性判断变化的词典提供更好的结果。此外,SELSP在极性预测任务中比基于Transformer的模型快得多。
  • 相关研究
    最近在这个领域中,也有一些相关的研究,例如“基于深度学习的情感分析”和“情感分析中的句法信息注入方法”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论