Hallucination Mitigation using Agentic AI Natural Language-Based Frameworks

Diego Gosmar ,
Deborah A. Dahl
2025年01月19日
  • 简介
    幻觉仍然是当前生成式人工智能模型中的一个重要挑战,削弱了人们对人工智能系统的信任及其可靠性。本研究探讨了如何通过协调多个专业的人工智能代理来减轻这些幻觉,重点是利用自然语言处理(NLP)技术以促进代理之间的无缝交互。为此,我们设计了一条流水线,将三百多个特意设计用于诱导幻觉的提示引入前端代理。然后,由第二级和第三级代理系统地审查和优化输出结果,每个代理使用不同的大型语言模型和定制策略来检测未验证的声明、加入明确的免责声明以及澄清推测性内容。此外,我们引入了一套新的关键绩效指标(KPI),专门用于评估幻觉评分水平。一个专门的第四级人工智能代理被用来评估这些KPI,提供详细的评估并确保准确量化与幻觉相关行为的变化。本研究的核心部分是使用OVON(开放语音网络)框架,该框架依赖于基于NLP的通用接口在代理之间传递上下文信息。通过结构化的JSON消息,每个代理传达其对幻觉可能性的评估及对可疑内容原因的解释,从而使得后续阶段能够在不丢失上下文的情况下优化文本。研究结果表明,通过NLP基础的代理框架实现互操作的多个专业代理可以有效减轻幻觉现象,最终增强人工智能社区的信任。
  • 图表
  • 解决问题
    该论文试图解决当前生成式AI模型中幻觉(hallucinations)的问题,这是一个影响AI系统信任度和可靠性的重大挑战。虽然幻觉问题已被广泛讨论,但通过多智能体协作来缓解这一问题的方法是一个新的研究方向。
  • 关键思路
    关键思路是通过设计一个多级智能体系统,每个智能体使用不同的大型语言模型和特定策略来检测、审查和修正由前端智能体产生的幻觉内容。这种方法利用了自然语言处理(NLP)技术,确保智能体之间的无缝交互,并通过OVON框架保持上下文信息的传递。相比现有研究,此方法强调了多智能体协作和专门化,以提高对幻觉内容的识别和纠正能力。
  • 其它亮点
    论文引入了一个包含300多个旨在引发幻觉的提示的测试集,这些提示被输入到前端智能体中,随后由二、三线智能体进行审核和改进。此外,还提出了新的KPIs用于量化幻觉水平,并由第四层智能体评估。实验设计严谨,采用结构化的JSON消息格式确保智能体间的信息流通。尽管未提及具体数据集或开源代码,该研究为未来在智能体协作及幻觉管理方面的工作奠定了基础。
  • 相关研究
    最近在这个领域内有几项相关研究,例如《Mitigating Hallucinations in Language Models via Contrastive Learning》探讨了通过对比学习减少幻觉的方法;《Detecting and Correcting Hallucinations in Dialogue Systems》专注于对话系统中的幻觉检测与校正;还有《Hallucination-Aware Neural Machine Translation》研究了神经机器翻译中的幻觉意识机制。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论