- 简介传统的监督学习在数据需求较高的神经网络方法中,严重依赖于人工标注的数据集。然而,各种任务,特别是像文档级关系抽取这样的多标签任务,由于特定的领域知识和大量的类别集合,完全手动注释存在困难。因此,我们解决了多标签正无标记学习(MLPUL)问题,其中只有一部分正类别被注释。我们提出了部分注释分类的混合学习器(MLPAC),这是一个基于强化学习的框架,结合了强化学习的探索能力和监督学习的开发能力。包括文档级关系抽取、多标签图像分类和二元PU学习在内的各种任务的实验结果表明,我们的框架具有广泛的泛化性和有效性。
-
- 图表
- 解决问题本论文旨在解决多标签正无标记学习(MLPUL)问题,其中只有一部分正类被注释的问题。这是一个新问题,因为在特定领域知识和大类集的情况下,完全手动注释是有挑战性的。
- 关键思路本文提出了一种基于强化学习的框架——部分注释分类的混合学习器(MLPAC),将强化学习的探索能力和监督学习的开发能力相结合,解决MLPUL问题。
- 其它亮点本文在不同任务上进行了实验,包括文档级关系提取、多标签图像分类和二元PU学习,并展示了MLPAC框架的泛化和有效性。值得关注的是,该框架不需要完全注释的数据集,具有很好的可扩展性和适应性。
- 近期的相关研究包括基于深度学习的多标签学习和正无标记学习,以及注释数据不足的学习方法。其中一些论文包括:“Multi-Label Learning with Missing Labels for Image Classification”和“Positive-Unlabeled Learning with Non-Negative Risk Estimator”。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流