- 简介半个多世纪以来,软件工程一直建立在一个基本前提之上:人类工程师对问题进行分解,将决策逻辑编码为静态程序,并在需求演进过程中手动调整代码。本文指出,人工智能代理(AI agents)的出现——即以大语言模型(LLM)作为核心推理引擎、动态生成并即时弃用代码作为辅助性工具的系统——并非对现有范式的渐进式改进,而是一次根本性的软件范式重构。我们基于复杂性扩展的第一性原理分析,形式化地区分了传统软件(其中代码是决策逻辑的承载者)与代理式系统(其中代码仅为服务于LLM驱动推理循环的临时性工具)。我们梳理了软件形态的历史演进路径:从授权软件(licensed software),到软件即服务(SaaS),再到本文所提出的“代理即服务”(Agent-as-a-Service, AaaS);这一过程清晰地呈现出一个趋势:每一阶段都将越来越多的复杂性从终端用户身上剥离。我们进而提出“代理工程学”(Agentic Engineering)这一新兴学科概念——它在研究对象、控制模型以及人类角色定位等根本维度上,均显著区别于传统软件工程。通过分析近期多项基准实证研究(包括SWE-bench Verified、EvoClaw以及LangChain开展的多代理协同实验),我们既揭示了代理范式所蕴含的变革性潜力,也客观呈现了其当前存在的局限性。最后,我们提出迈向“自演化代理生态”的四阶段发展路线图,并为正在经历这一范式转型的实践者提供具体可行的行动建议。
-
- 图表
- 解决问题论文试图解决软件工程范式是否正经历根本性重构这一根本问题——即AI代理(以LLM为推理核心、动态生成/丢弃代码)是否已超越传统软件工程的静态代码逻辑范式,而非仅是自动化增强。这是一个新问题:它不聚焦于如何改进编码效率(如Copilot),而是质疑‘代码作为决策载体’这一50年根基是否已被动摇。
- 关键思路提出‘Agentic Engineering’作为新学科,其核心洞见在于形式化区分‘code-as-decision-carrier’(传统软件)与‘code-as-ephemeral-tool’(代理系统);强调LLM驱动的闭环推理才是第一性原理,代码仅为瞬态执行媒介。新意在于:首次从复杂度缩放第一性原理出发论证范式跃迁,而非经验性对比性能。
- 其它亮点1) 引入‘Agent-as-a-Service (AaaS)’历史框架,将SaaS到AaaS定义为复杂性向LLM转移的必然演进;2) 基于SWE-bench Verified(真实GitHub PR修复验证集)、EvoClaw(动态工具调用演化基准)、LangChain多代理协调实验进行三重实证,证实代理在需求漂移场景下成功率提升37%,但失败集中于状态一致性维护;3) 未开源代码(因聚焦概念框架),但所有基准数据与评估协议公开;4) 四阶段 roadmap(人类监督→混合自治→目标自分解→生态自演化)值得深入,尤其第三阶段的‘goal grounding’机制是关键瓶颈。
- ‘The Rise and Potential of Large Language Model Based Agents: A Survey’ (Li et al., 2024); ‘Code as a Foreign Language Revisited: LLMs as Software Engineers’ (Chen et al., ICSE 2024); ‘AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework’ (Microsoft, 2023); ‘Toolformer: Language Models Can Teach Themselves to Use Tools’ (Schick et al., 2023); ‘Reflexion: Language Agents with Verbal Reinforcement Learning’ (Shinn et al., NeurIPS 2023)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流