- 简介本文介绍了Pandemic PACT高级分类引擎(PPACE)及其相关数据集。PPACE是一种经过优化的模型,旨在根据世界卫生组织对研究优先事项的要求,自动对资助的生物医学项目的研究摘要进行分类。这项任务对于监测研究趋势并确定全球卫生准备和响应的差距至关重要。我们的方法基于人类注释的项目,这些项目从预定义的列表中分配一个或多个类别。然后使用大型语言模型生成“理由”,解释这些注释背后的推理。这些增强型数据包括专家注释和理由,随后用于优化更小、更高效的模型。PPACE是Pandemic PACT项目的一部分,该项目旨在追踪和分析具有爆发潜力的各种疾病的研究资金和临床证据,支持研究资助者、政策制定者和独立研究者做出明智决策。我们介绍并发布了训练模型和用于训练的基于指令的数据集。我们的评估结果表明,PPACE明显优于基线。PPACE及其相关数据集的发布为多标签生物医学文档分类的研究人员提供了宝贵的资源,并支持将生物医学研究与关键全球卫生优先事项对齐的进展。
- 图表
- 解决问题该论文旨在解决自动对生物医学研究摘要进行分类的问题,以便监测研究趋势并确定全球卫生应对的差距。
- 关键思路该论文的关键思路是使用预定义的类别列表对人工注释的项目进行分类,并利用生成的“原理”来微调更小、更高效的模型。
- 其它亮点该论文介绍了Pandemic PACT Advanced Categorisation Engine(PPACE)及其相关数据集,PPACE是一个经过精细调整的模型,可根据WHO对齐的研究重点自动分类受资助的生物医学项目的研究摘要。该论文还介绍了Pandemic PACT项目,该项目旨在跟踪和分析具有疫情潜力的广泛疾病的研究资金和临床证据,支持研究资助者、政策制定者和独立研究人员做出明智决策。作者发布了经过训练的模型和用于训练的基于指令的数据集。实验结果表明,PPACE显著优于基线模型。该论文的亮点还包括支持全球卫生优先事项的生物医学研究的自动分类方法。
- 最近的相关研究包括使用机器学习方法对生物医学文本进行分类的研究,例如“Automated Classification of Radiology Reports for Acute Stroke and Transient Ischaemic Attack”和“Machine Learning for Medical Literature Understanding”。
沙发等你来抢
去评论
评论
沙发等你来抢