- 简介自从逻辑推理任务被提出以来,它一直受到极大的关注。面对这样的任务,当前的竞争模型,即使是大型语言模型(例如ChatGPT和PaLM 2),仍然表现不佳。以前有前途的语言模型在逻辑一致性建模和逻辑结构感知方面存在困难。为此,我们通过将每个逻辑样本转化为推理路径来对逻辑推理任务进行建模,并提出了一种架构PathReasoner。它从数据和模型的角度来解决这个任务。为了扩展逻辑样本的多样性,我们提出了一种原子扩展策略,支持等价逻辑公式,以形成新的推理路径。从模型的角度来看,我们设计了一堆变压器风格的块。特别地,我们提出了一种路径注意力模块,以高阶扩散策略联合模型内原子和跨原子关系。实验表明,PathReasoner在两个逻辑推理基准测试中取得了竞争性能,并具有很好的泛化能力。
- 图表
- 解决问题论文试图解决逻辑推理任务的问题,当前竞争模型,甚至包括大型语言模型仍然表现不佳。
- 关键思路论文提出了一种新的架构PathReasoner,通过将每个逻辑样本转换为推理路径来建模逻辑推理任务。从数据和模型的角度解决问题。通过扩展逻辑公式来扩展逻辑样本的多样性,并设计了一堆变压器风格的块,特别是提出了路径注意力模块来联合建模原子内和跨原子关系。
- 其它亮点论文的实验表明,PathReasoner在两个逻辑推理基准测试上取得了竞争性能和良好的泛化能力。值得注意的是,论文提出的原子扩展策略和路径注意力模块为解决逻辑一致性建模和逻辑结构感知提供了新的思路和方法。
- 最近在逻辑推理领域中,还有一些相关的研究,如NeuralLP和R-GCN等。
沙发等你来抢
去评论
评论
沙发等你来抢