Prompt-RAG: Pioneering Vector Embedding-Free Retrieval-Augmented Generation in Niche Domains, Exemplified by Korean Medicine

2024年01月20日
  • 简介
    我们提出了一种自然语言提示检索增强生成(Prompt-RAG)的新方法,用于增强生成型大语言模型(LLM)在利基领域中的性能。传统的RAG方法大多需要向量嵌入,然而,通用LLM嵌入表示对于专业领域的适用性仍然不确定。为了探索和举例说明这一点,我们比较了韩医和传统医学文献的向量嵌入,发现韩医文献嵌入与标记重叠相关性更高,与人工评估的文献相关性相关性较低,相比之下传统医学文献则相反。Prompt-RAG与传统的RAG模型不同,无需嵌入向量即可运行。它的性能通过问答(QA)聊天机器人应用程序进行评估,其中响应被评估为相关性、可读性和信息量。结果显示,Prompt-RAG在相关性和信息性方面优于现有模型,包括ChatGPT和传统的向量嵌入RAG。尽管存在内容结构和响应延迟等挑战,但LLM的进步预计将鼓励使用Prompt-RAG,使其成为其他需要RAG方法的领域的有前途的工具。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在提出一种名为Prompt-RAG的新方法,以增强生成式大型语言模型在特定领域中的性能。
  • 关键思路
    Prompt-RAG是一种新颖的方法,可在特定领域中提高生成式大型语言模型的性能,而不需要向量嵌入。
  • 其它亮点
    通过问答聊天机器人应用程序对Prompt-RAG的性能进行了评估,结果表明Prompt-RAG在相关性和信息性方面优于现有模型,包括ChatGPT和传统的基于向量嵌入的RAG。
  • 相关研究
    在这个领域中,最近的相关研究包括“Large Scale Retrieval-Augmented Generation for Open-Domain Question Answering”和“Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问