Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction

2024年06月26日
  • 简介
    Aspect Sentiment Quad Prediction(ASQP)旨在预测给定评论中所有四元组(方面术语、方面类别、观点术语、情感极性),这是方面情感分析中最具代表性和最具挑战性的任务。ASQP任务中的一个关键挑战是标注数据的稀缺性,这限制了现有方法的性能。为了解决这个问题,我们提出了一个自我训练框架,其中包括一个伪标签评分器,评分器评估评论和它们的伪标签之间的匹配程度,旨在过滤出不匹配的部分,从而增强自我训练的效果。我们强调了两个关键方面,以确保评分器的效果和可靠性:训练数据集的质量和模型架构。为此,我们创建了一个人工注释的比较数据集,并使用基于排名的目标在其上训练了一个生成模型。对公共ASQP数据集进行的广泛实验表明,使用我们的评分器可以极大地并且一致地提高自我训练的效果。此外,我们探索了使用大型语言模型替换人类进行比较数据集注释的可能性,实验证明了其可行性。我们在https://github.com/HITSZ-HLT/ST-w-Scorer-ABSA上发布了我们的代码和数据。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决方面情感分析中标注数据稀缺的问题,提出了一种基于自训练框架和伪标签评分器的解决方案。
  • 关键思路
    论文提出了一种自训练框架,其中伪标签评分器评估评论与其伪标签之间的匹配程度,以过滤不匹配的标签,从而提高自训练的有效性和可靠性。
  • 其它亮点
    论文通过创建人工比较数据集和训练生成模型来确保评分器的有效性和可靠性,并探索使用大型语言模型替换人类进行比较数据集注释的可能性。实验结果表明,使用伪标签评分器可以显著且一致地提高自训练的有效性。
  • 相关研究
    近期在该领域的相关研究包括:1.《BERT-based Neural Model for Aspect-Based Sentiment Analysis》;2.《A Survey of Aspect-Based Sentiment Analysis》;3.《Improving Aspect-Based Sentiment Analysis with Generative Adversarial Networks and Large-Scale Unlabeled Data》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问