Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models

简介

大规模语言模型（LLMs）在各种语言任务上取得了显著的成功，但存在幻觉和时间错位的问题。为了缓解这些缺点，检索增强生成（RAG）被用来提供外部知识以促进答案生成。然而，将这样的模型应用于医学领域面临着几个挑战，因为缺乏领域特定的知识和真实世界场景的复杂性。在本研究中，我们探讨了在医学领域中使用RAG框架的LLMs进行知识密集型任务。为了评估LLMs的能力，我们介绍了MedicineQA，一个模拟真实药物咨询场景的多轮对话基准，需要LLMs使用从药品数据库中检索到的证据来回答问题。MedicineQA包含300个多轮问答对，每个对话历史都嵌入了详细的对话历史，突显了这个知识密集型任务对当前LLMs的挑战。我们进一步提出了一个新的“Distill-Retrieve-Read”框架，而不是以前的“Retrieve-then-Read”框架。具体而言，蒸馏和检索过程利用工具调用机制来制定搜索查询，模拟搜索引擎使用的基于关键字的查询。通过实验结果，我们展示了我们的框架带来的显着性能提升，并在证据检索准确性方面超越了以前的对手。这一进步为将RAG应用于医学领域带来了启示。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图探索如何将大规模语言模型与检索增强生成（RAG）框架应用于医学领域的知识密集型任务，以解决当前模型存在的幻觉和时间错位等问题。
关键思路

论文提出了一种新的框架——Distill-Retrieve-Read，它通过调用工具机制来制定搜索查询，模拟搜索引擎使用的基于关键字的查询，从而提高证据检索的准确性。
其它亮点

论文提出了一个医学对话基准——MedicineQA，其中包含300个多轮对话问题-回答对，每个问题都嵌入在详细的对话历史中。实验结果表明，Distill-Retrieve-Read框架在证据检索准确性方面优于以前的方法，并为将RAG应用于医学领域提供了新思路。
相关研究

最近的相关研究包括使用RAG框架进行问答任务的研究，如《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。

Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models

提问交流

提问交流