LLM-based Extraction of Contradictions from Patents

2024年03月21日
  • 简介
    TRIZ自1950年代以来已经表明,专利及其解决的技术矛盾是开发创新产品的重要灵感来源。然而,TRIZ是一种基于历史专利分析的启发式方法,没有利用当前专利中不断增加的最新技术解决方案。由于专利数量巨大、长度长且复杂,因此需要现代专利检索和分析超越基于关键词的方法。最近专利检索和分析的进展主要集中在基于神经AI Transformer语言模型(如Google BERT)的密集向量上。它们例如用于密集检索、问答或摘要和关键概念提取。专利摘要和关键概念提取方法中的一个研究重点分别是通用发明概念和TRIZ概念,例如问题、解决方案、发明的优点、参数和矛盾。在基于规则的方法成功之后,对于基于句子的分类而微调的BERT-like语言模型代表了发明概念提取的最新技术水平。虽然它们对于像问题或解决方案这样的基本概念工作得相对较好,但矛盾作为更复杂的抽象仍然是这些模型面临的挑战。本文更进一步,因为它提出了一种基于Prompt Engineering的方法,利用生成式大语言模型(LLM)OpenAI的GPT-4从专利文本中提取TRIZ矛盾。矛盾检测、句子提取、矛盾摘要、参数提取和分配到39个抽象的TRIZ工程参数都在一个单独的提示中使用LangChain框架进行。我们的结果表明,“现成的”GPT-4是现有方法的一个严肃的替代方案。
  • 图表
  • 解决问题
    如何从专利文本中提取TRIZ矛盾?
  • 关键思路
    使用基于Prompt Engineering的生成式大型语言模型GPT-4进行TRIZ矛盾提取
  • 其它亮点
    使用LangChain框架在单个提示中执行矛盾检测、句子提取、矛盾摘要、参数提取和分配,可以替代现有方法
  • 相关研究
    最近的研究集中在基于神经网络的语言模型,如Google BERT,用于专利检索和分析
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论