Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering

2026年04月09日
  • 简介
    大语言模型(LLM)智能体的构建,正日益转向对模型运行时环境的重构,而非直接修改模型权重。过去系统期望模型在内部自主习得的能力,如今正被逐步外化为外部记忆存储、可复用的技能模块、交互协议,以及支撑这些模块在实际中稳定可靠运行的底层运行框架(harness)。本文即以“外化”(externalization)为视角,系统梳理这一范式转变。借鉴“认知人工制品”(cognitive artifacts)的概念,我们认为:智能体基础设施之所以关键,不仅在于其引入了辅助性组件,更在于它将原本难以由模型直接应对的复杂认知负担,转化为模型更擅长、更可靠处理的形式。依此观点,记忆机制实现了状态在时间维度上的外化,技能模块实现了程序性专业知识的外化,交互协议实现了协作与沟通结构的外化,而运行框架工程则作为统一整合层,协调上述各类外化模块,实现受控、可治理的执行过程。我们梳理了智能体架构从“依赖模型参数”到“依赖上下文输入”,再到“依赖运行框架”的历史演进脉络;将记忆、技能与协议界定为三种彼此区分却又紧密耦合的外化形式,并深入分析它们如何在一个更大规模的智能体系统中协同运作。此外,我们探讨了参数化能力与外化能力之间的权衡取舍,指出若干新兴发展方向,例如具备自我演化能力的运行框架、跨智能体共享的基础设施;并进一步讨论了当前在评估方法、治理机制,以及模型与外部基础设施长期协同演进等方面所面临的一系列开放性挑战。最终,本文构建了一个面向系统的理论框架,用以阐释为何智能体在实践层面的持续进步,越来越不仅取决于模型本身能力的增强,更取决于更优、更健壮的外部认知基础设施的构建与完善。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图解决大型语言模型(LLM)智能体实际部署中日益凸显的‘能力瓶颈’问题:即单纯依赖模型参数(weights)内部表征已难以支撑可靠、可扩展、可治理的复杂认知任务;核心假设是——系统级进步正从‘更强的模型’转向‘更优的外部认知基础设施’,这一范式转移亟需系统性刻画与理论阐释。该问题在工程实践层面已被广泛感知,但尚缺乏统一的概念框架和认知科学基础的系统性论述,因此具有理论新颖性与范式定义意义。
  • 关键思路
    提出‘外部化(externalization)’作为理解LLM智能体演进的核心透镜,借鉴认知科学中的‘认知人工物(cognitive artifacts)’理论,将记忆(跨时间状态保持)、技能(可复用程序化能力)、协议(结构化交互规则)和运行时‘驾驭层(harness)’(协调与治理模块)共同建模为将硬性认知负担转化为模型更易处理形式的认知卸载机制;其新意在于超越传统‘插件’或‘工具调用’的工程视角,首次将agent基础设施上升为与模型权重同等重要的认知构成层级,并构建了‘weights → context → harness’的历史演进框架。
  • 其它亮点
    亮点包括:1)首次建立基于认知科学的系统级分析框架,赋予memory/skills/protocols明确的认知功能定位而非技术组件标签;2)揭示三类外部化形式的耦合性(如协议约束技能调用,记忆支持协议状态延续);3)提出关键权衡‘参数化能力 vs 外部化能力’,指出过度外部化可能损害泛化与鲁棒性;4)前瞻性讨论自演化驾驭层、共享代理基础设施等方向;5)全文为概念性综述,无实验/数据集/代码,但通过多阶段历史分析与跨学科类比(如分布式认知、人机协同)进行严谨论证;值得深入的方向包括:外部化程度的量化评估指标、harness的可验证性设计、以及模型-基础设施联合训练范式。
  • 相关研究
    近期相关研究包括:'ReAct: Synergizing Reasoning and Acting in Language Models'(Wang et al., 2023);'Reflexion: Language Agents with Verbal Reinforcement Learning'(Shinn et al., 2023);'The Rise and Potential of Large Language Model Based Agents: A Survey'(Zhu et al., 2024);'AgentScope: A Flexible and Practical Framework for LLM-based Agents'(Liu et al., 2024);'Cognition as a Service: Towards Composable Cognitive Infrastructure'(Bubeck et al., 2023, arXiv)
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问