- 简介将短科学文本(如资助或出版物摘要)进行粗略分类,以获取战略洞见或研究组合管理是可取的。这些文本高效地向具有丰富知识体系的专家传递密集信息,以帮助解释。然而,由于简洁性和缺乏上下文,这项任务极为困难,难以自动化。为了填补这一空白,我们开发了一种新方法,生成并适当分配粗略的领域特定标签。我们展示了大型语言模型(LLM)可以提供此任务所必需的元数据,这类似于增强代表人类直觉的补充知识,并提出了一种工作流程。作为试点研究,我们使用了美国国家航空航天局(NASA)的奖项摘要语料库。我们与既有的性能指标一起开发了新的评估工具。
- 图表
- 解决问题如何通过自然语言处理技术对短的科学文本进行粗略分类?
- 关键思路利用大型语言模型(LLM)生成并适当分配领域特定的标签。
- 其它亮点论文提出了一种新的方法,使用LLM生成元数据来辅助短文本分类,提出了一个工作流程。实验使用了NASA的奖励摘要语料库,并开发了新的评估工具。这种方法可以为科学家提供更好的研究组合管理。
- 最近的相关研究包括使用深度学习模型进行文本分类的研究,如《A Convolutional Neural Network for Text Classification》和《Recurrent Convolutional Neural Networks for Text Classification》。
沙发等你来抢
去评论
评论
沙发等你来抢