Multi-step Knowledge Retrieval and Inference over Unstructured Data

2024年06月26日
  • 简介
    大型语言模型(LLM)和生成式人工智能的出现彻底改变了各个领域中自然语言应用。然而,在医疗、法律和金融等领域中,高风险的决策任务需要一定的准确性、全面性和逻辑一致性,而纯粹的LLM或检索增强生成(RAG)方法往往无法达到这一要求。在Elemental Cognition(EC),我们开发了一种神经符号AI平台来解决这些问题。该平台将经过微调的LLM用于知识提取和对齐,并与强大的符号推理引擎集成,用于逻辑推理、规划和交互式约束求解。我们描述了Cora,这是一个建立在这个平台上的协作研究助手,旨在在高风险领域执行复杂的研究和发现任务。本文讨论了这些领域固有的多步推理挑战,批评了现有基于LLM的方法的局限性,并展示了Cora的神经符号方法如何有效地解决这些问题。我们提供了系统架构的概述、知识提取和形式推理的关键算法,并提供了初步评估结果,突出了Cora与知名的LLM和RAG基线相比的优越性能。
  • 图表
  • 解决问题
    使用神经符号学习平台解决高风险决策领域中的复杂研究和发现任务。
  • 关键思路
    在Elemental Cognition(EC)开发的神经符号AI平台中,将微调的LLMs用于知识提取和对齐,并与强大的符号推理引擎集成,以进行逻辑推理、规划和交互式约束求解,实现对高风险决策领域中的复杂研究和发现任务的有效解决。
  • 其它亮点
    论文讨论了这些领域内固有的多步推理挑战,批评了现有基于LLM的方法的局限性,并演示了Cora的神经符号方法如何有效地解决这些问题。论文提供了系统架构概述、知识提取和形式推理的关键算法,并呈现了初步评估结果,突出了Cora相对于众所周知的LLM和RAG基线的卓越性能。
  • 相关研究
    最近的相关研究包括:《Large-Scale Pretraining for Neural Machine Translation》、《GPT-3: Language Models are Few-Shot Learners》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论