Artificial Intuition: Efficient Classification of Scientific Abstracts

2024年07月08日
  • 简介
    将短科学文本(如资助或出版物摘要)进行粗略分类,以获取战略洞见或研究组合管理是可取的。这些文本高效地向具有丰富知识体系的专家传递密集信息,以帮助解释。然而,由于简洁性和缺乏上下文,这项任务极为困难,难以自动化。为了填补这一空白,我们开发了一种新方法,生成并适当分配粗略的领域特定标签。我们展示了大型语言模型(LLM)可以提供此任务所必需的元数据,这类似于增强代表人类直觉的补充知识,并提出了一种工作流程。作为试点研究,我们使用了美国国家航空航天局(NASA)的奖项摘要语料库。我们与既有的性能指标一起开发了新的评估工具。
  • 图表
  • 解决问题
    如何通过自然语言处理技术对短的科学文本进行粗略分类?
  • 关键思路
    利用大型语言模型(LLM)生成并适当分配领域特定的标签。
  • 其它亮点
    论文提出了一种新的方法,使用LLM生成元数据来辅助短文本分类,提出了一个工作流程。实验使用了NASA的奖励摘要语料库,并开发了新的评估工具。这种方法可以为科学家提供更好的研究组合管理。
  • 相关研究
    最近的相关研究包括使用深度学习模型进行文本分类的研究,如《A Convolutional Neural Network for Text Classification》和《Recurrent Convolutional Neural Networks for Text Classification》。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论