Artificial Intuition: Efficient Classification of Scientific Abstracts

简介

将短科学文本（如资助或出版物摘要）进行粗略分类，以获取战略洞见或研究组合管理是可取的。这些文本高效地向具有丰富知识体系的专家传递密集信息，以帮助解释。然而，由于简洁性和缺乏上下文，这项任务极为困难，难以自动化。为了填补这一空白，我们开发了一种新方法，生成并适当分配粗略的领域特定标签。我们展示了大型语言模型（LLM）可以提供此任务所必需的元数据，这类似于增强代表人类直觉的补充知识，并提出了一种工作流程。作为试点研究，我们使用了美国国家航空航天局（NASA）的奖项摘要语料库。我们与既有的性能指标一起开发了新的评估工具。
图表
解决问题

如何通过自然语言处理技术对短的科学文本进行粗略分类？
关键思路

利用大型语言模型（LLM）生成并适当分配领域特定的标签。
其它亮点

论文提出了一种新的方法，使用LLM生成元数据来辅助短文本分类，提出了一个工作流程。实验使用了NASA的奖励摘要语料库，并开发了新的评估工具。这种方法可以为科学家提供更好的研究组合管理。
相关研究

最近的相关研究包括使用深度学习模型进行文本分类的研究，如《A Convolutional Neural Network for Text Classification》和《Recurrent Convolutional Neural Networks for Text Classification》。