【推荐理由】本文提出一种依赖于大型语言模型的新的知识提取方法,用于创建知识库和本体。该方法具有易定制、灵活和关键的能力, 即在没有任何训练数据的情况下执行新任务的能力。

Structured prompt interrogation and recursive extraction of semantics (SPIRES): A method for populating knowledge bases using zero-shot learning
J. Harry Caufield, Harshad Hegde, Vincent Emonet, Nomi L. Harris, Marcin P. Joachimiak, Nicolas Matentzoglu, HyeongSik Kim, Sierra A. T. Moxon, Justin T. Reese, Melissa A. Haendel, Peter N. Robinson, Christopher J. Mungall

【论文链接】https://arxiv.org/pdf/2304.02711.pdf

【项目链接】https://github.com/monarch-initiative/ontogpt

【摘要】创建知识库和本体是一项耗时的任务,它依赖于手动管理。 AI/NLP 方法可以帮助专家策展人填充这些知识库,但当前的方法依赖于大量的训练数据,并且无法填充任意复杂的嵌套知识模式。 在这里,本文介绍了结构化提示询问和语义递归提取 (SPIRES),这是一种知识提取方法,它依赖于大型语言模型 (LLM) 的能力来执行零样本学习 (ZSL) 和从灵活的提示和通用查询回答 返回符合指定模式的信息。 给定详细的、用户定义的知识模式和输入文本,SPIERS 递归地对 GPT-3+ 执行提示询问,以获得与提供的模式匹配的一组响应。 SPIERS 使用现有的本体论和词汇表为所有匹配的元素提供标识符。 作者展示了 SPIERS 在不同领域的使用示例,包括食物食谱的提取、多物种细胞信号通路、疾病治疗、多步骤药物机制以及化学物质与疾病的因果关系图。 目前的 SPIERS 准确性与现有关系提取 (RE) 方法的中等水平相当,但具有易于定制、灵活的优势,而且至关重要的是,能够在没有任何训练数据的情况下执行新任务。 这种方法支持利用 LLM 的语言解释能力来组装知识库、协助手动知识管理和获取,同时支持使用公开可用的数据库和 LLM 外部的本体进行验证的一般策略。

内容中包含的图片若涉及版权问题,请及时与我们联系删除