GeneAgent: Self-verification Language Agent for Gene Set Knowledge Discovery using Domain Databases

2024年05月25日
  • 简介
    基因集知识发现对于推进人类功能基因组学至关重要。最近的研究表明,利用大型语言模型(LLMs)在此任务上具有良好的性能。然而,它们的结果受到LLMs中常见的幻觉等多种限制的影响。为此,我们提出了GeneAgent,这是一种具有自我验证能力的首款语言代理。它自主地与各种生物数据库进行交互,并利用相关的领域知识来提高准确性并减少幻觉发生的次数。在来自不同来源的1,106个基因集上进行基准测试,GeneAgent始终比标准的GPT-4表现出更好的性能。此外,详细的手动审核确认了自我验证模块在最小化幻觉和生成更可靠的分析叙述方面的有效性。为了展示其实际效用,我们将GeneAgent应用于从小鼠B2905黑色素瘤细胞系中得出的七个新基因集,专家评估表明,GeneAgent为基因功能提供了新的见解,并随后加速了知识发现。
  • 图表
  • 解决问题
    本论文旨在解决基因集知识发现中存在的幻觉问题,提出了一种具有自我验证功能的语言代理GeneAgent。
  • 关键思路
    GeneAgent是一种自主与生物数据库交互的语言代理,利用相关领域知识来提高准确性并减少幻觉发生。它在1,106个基因集上进行了基准测试,结果表明GeneAgent在减少幻觉的同时,能够显著提高分析结果的可靠性。
  • 其它亮点
    本文提出了一种具有自我验证功能的语言代理GeneAgent,能够有效减少基因集知识发现中的幻觉问题;GeneAgent在1,106个基因集上进行基准测试,结果表明其在减少幻觉的同时,能够显著提高分析结果的可靠性;研究人员还将GeneAgent应用于七个新的基因集,证明其在加速知识发现方面具有实际应用价值。
  • 相关研究
    最近的相关研究包括利用大型语言模型进行基因集知识发现的工作。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论