BiomedRAG: A Retrieval Augmented Large Language Model for Biomedicine

2024年05月01日
  • 简介
    大型语言模型(LLMs)已迅速成为生物医学和医疗保健领域中不同应用的重要资源;然而,这些模型遇到了生成不准确的信息或幻觉等问题。检索增强生成为这些模型提供了解决方案,以更新知识并增强其性能。与以前的检索增强LLMs不同,BiomedRAG采用更简单的方法,直接将检索到的基于块的文档输入到LLM中。这种简单的设计易于应用于现有的检索和语言模型,有效地绕过了检索文档中的噪声信息,特别是在噪声密集的任务中。此外,我们展示了利用LLM监督生物医学领域的检索模型的潜力,使其检索文档以帮助LM改进其预测。我们的实验表明,使用调整后的评分器,BiomedRAG在涵盖信息提取(三元组提取,关系提取)、文本分类、链接预测和问答等5个生物医学NLP任务中表现出优异的性能,利用了超过9个数据集。例如,在三元组提取任务中,BiomedRAG在GIT和ChemProt语料库上的微平均F1分别为81.42和88.83,优于其他三元组提取系统。
  • 图表
  • 解决问题
    本论文旨在解决大语言模型在生物医学和医疗领域应用中存在的问题,如生成不准确的信息或幻觉。作者提出了一种检索增强生成的方法,以更新知识并提高性能。
  • 关键思路
    与以往的检索增强模型不同,BiomedRAG采用了更简单的方法,直接将检索到的基于块的文档输入到大语言模型中。这种直接的设计易于应用于现有的检索和语言模型,能够有效地绕过检索文档中的噪声信息,特别是在噪声密集的任务中。
  • 其它亮点
    实验结果表明,BiomedRAG在5个生物医学自然语言处理任务中表现优异,包括信息提取、文本分类、链接预测和问答等,共使用了9个数据集。在三元组提取任务中,BiomedRAG在GIT和ChemProt语料库上的微平均F1分数分别为81.42和88.83。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks、Improving Biomedical Named Entity Recognition with Neural Network Models、A Survey on Biomedical Named Entity Recognition等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论