- 简介Claude Code 是一款具备自主行为能力的编程辅助工具,可代表用户执行 Shell 命令、编辑文件,并调用外部服务。本研究通过分析其公开发布的 TypeScript 源代码,系统阐述了该工具的整体架构;并进一步将其与 OpenClaw(一个独立开发的开源人工智能代理系统)进行对比——后者虽面向不同部署场景,却在诸多核心设计问题上给出了相似的解答。我们的分析提炼出驱动该架构设计的五大人类价值取向、哲学理念与实际需求:人类决策主导权、安全与保障、执行可靠性、能力增强性,以及情境适应性;并据此追溯出十三条具体的设计原则,进而映射至各项关键技术实现方案。该系统的核心逻辑极为简洁:一个基础的 while 循环,依次调用大语言模型、执行工具函数,再循环往复。然而,系统绝大部分代码并非位于该主循环内部,而是分布于围绕它的各类支撑子系统之中:包括一套拥有七种权限模式并辅以机器学习分类器的细粒度权限控制系统;一条用于上下文管理的五级压缩流水线;四种扩展机制——MCP(Model-Client Protocol)、插件(plugins)、技能(skills)和钩子(hooks);一种支持工作树(worktree)隔离的子代理委托机制;以及一种以追加(append)方式写入的会话存储方案。与 OpenClaw(一个多通道个人助理网关)的对比表明:当部署场景发生变化时,尽管面临相同的一系列反复出现的设计挑战,系统最终呈现的架构形态却显著不同——例如,在安全性方面,从针对单次操作的细粒度安全分类,转向面向整个系统边界的访问控制;在运行时结构上,从单一命令行接口(CLI)循环,演进为嵌入式运行于网关控制平面之内的轻量级运行时;在能力管理上,则从单纯依赖上下文窗口扩展,升级为面向整个网关范围的能力注册与发现机制。最后,我们基于近期实证研究、架构实践及政策文献,归纳出未来智能代理系统亟待探索的六大开放性设计方向。
-
- 图表
- 解决问题如何在真实世界部署的AI编码代理系统中,将人类价值观(如决策权威、安全、可靠性等)系统性地转化为可工程化的架构设计原则与实现机制;这不是单纯的安全或效率优化问题,而是价值对齐(value-aligned architecture)在agentic系统中的首次全栈实证分析。
- 关键思路提出‘价值驱动架构映射’范式:将5项根本性人类价值直接映射为13条设计原则,并逐层落地到具体模块(如七模式权限系统对应‘人类决策权威’与‘安全’,五层上下文压缩对应‘可靠执行’与‘ contextual adaptability’);区别于主流端到端微调或RLHF路径,本工作以架构即接口(architecture-as-interface)为核心创新,证明价值对齐可通过对系统边界、控制流和扩展契约的显式建模来实现。
- 其它亮点首次公开解析Claude Code生产级TypeScript代码库的架构逻辑(非API文档,而是源码级反向工程);引入ML驱动的实时权限分类器(非静态RBAC);提出‘append-oriented session storage’支持审计可追溯性;与OpenClaw的跨上下文对比揭示部署场景对架构选择的决定性影响;全文无黑箱实验,所有结论均来自代码语义分析+架构比较+设计意图溯因;代码未开源但分析方法完全可复现;值得深入的方向包括:价值-原则映射的自动化验证、子代理工作树的沙箱形式化验证、MCP协议与OS能力模型的语义对齐。
- ‘The Architecture of Autonomy: Design Principles for Trustworthy AI Agents’ (FAccT ’23); ‘LangChain: A Framework for Compositional Language Modeling’ (arXiv:2302.12879); ‘OpenClaw: A Multi-Channel Gateway for Personal AI Assistants’ (OSDI ’24); ‘SWE-bench: Benchmarking Coding Agents on Real-World GitHub Issues’ (ICLR ’24); ‘Toolformer: Language Models Can Teach Themselves to Use Tools’ (NeurIPS ’23); ‘Security and Safety in Agentic Systems: A Taxonomy and Empirical Study’ (USENIX Security ’24)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流