【标题】A Reinforced Active Learning Approach for Optimal Sampling in Aspect Term Extraction for Sentiment Analysis

【作者团队】Manju Venugopalan, Deepa Gupta

【发表日期】2022.7.21

【论文链接】https://www.sciencedirect.com/sdfe/reader/pii/S0957417422013793/pdf

【推荐理由】方面级别的情感分析是情感分析中的一项细节任务,它从一段自以为是的文本中识别产品特征,并将情感映射到每个特征。有监督的 ML 算法在方面级别的情感分析上报告了相对较高的性能,但代价是大量的定性标记数据。此类细节任务的数据标记也需要领域专业知识。因此,提取几乎代表整个数据的最小信息子集的机制将是在很大程度上降低注释成本的突破。本文所提出的方法是一种基于主动学习的采样策略,用于方面术语提取,这是方面水平情感分析中的一个子任务,用于识别产品特征。采样策略通过强化学习实现自动化,从整个未标记的训练数据中提取最佳样本,从而通过减少与标记过程相关的时间和精力来优化数据注释。在数据驱动的时代,这项工作非常重要。该模型已在 SemEval(2014-2016) 数据集的笔记本电脑和餐厅领域进行了试验。实验证明,在不同的数据集上可以显著减少训练数据的大小。