- 简介Twitter已成为全球参与在线交流和各学科研究用户生成内容的中心。论证挖掘是处理和理解在线话语的重要分析任务,旨在识别论点的结构要素,即信息和推理。然而,这些要素并不是静态的,可能需要在它们所在的对话中提供上下文,但是在Twitter上缺乏解决这一动态方面的数据和注释框架。我们提供了TACO,这是第一个使用1,814条推文涵盖200个完整对话的Twitter论点数据集,涵盖六个异构主题,并在六位专家之间达成0.718的Krippendorff's alpha一致性。其次,我们提供了我们的注释框架,结合了剑桥词典的定义,以定义和识别Twitter上的论点组成部分。我们的基于Transformer的分类器在检测论点方面实现了85.06\%的宏F1基线得分。此外,我们的数据表明,Twitter用户倾向于参与涉及知情推理和信息的讨论。TACO具有多种用途,例如训练推文分类器以基于推理和信息要素管理推文,同时为推文的对话回复模式提供有价值的见解。
- 图表
- 解决问题论文旨在解决Twitter上动态争论的结构元素识别问题,即信息和推理的识别,并提出了TACO数据集和注释框架。
- 关键思路该论文提出了一个基于Transformer的分类器,能够识别Twitter上的争论,并提供了一种注释框架,以定义和识别Twitter上的争论组成部分。
- 其它亮点TACO数据集包含1,814条推文,涵盖了200个完整的对话,跨足了六个异构话题,并获得了六位专家的0.718 Krippendorff's alpha一致性。研究结果表明,Twitter用户倾向于参与包含信息推理和信息的讨论。该论文的方法在Twitter上动态争论的结构元素识别方面取得了很好的效果。
- 近年来,关于Twitter上的动态争论的研究越来越多,例如“Detecting Stance in Tweets Using Deep Neural Networks”和“Argument Mining on Twitter: Arguments, Facts and Sources”。
沙发等你来抢
去评论
评论
沙发等你来抢