The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm

向作者提问

NEW

简介

半个多世纪以来，软件工程一直建立在一个基本前提之上：人类工程师对问题进行分解，将决策逻辑编码为静态程序，并在需求演进过程中手动调整代码。本文指出，人工智能代理（AI agents）的出现——即以大语言模型（LLM）作为核心推理引擎、动态生成并即时弃用代码作为辅助性工具的系统——并非对现有范式的渐进式改进，而是一次根本性的软件范式重构。我们基于复杂性扩展的第一性原理分析，形式化地区分了传统软件（其中代码是决策逻辑的承载者）与代理式系统（其中代码仅为服务于LLM驱动推理循环的临时性工具）。我们梳理了软件形态的历史演进路径：从授权软件（licensed software），到软件即服务（SaaS），再到本文所提出的“代理即服务”（Agent-as-a-Service, AaaS）；这一过程清晰地呈现出一个趋势：每一阶段都将越来越多的复杂性从终端用户身上剥离。我们进而提出“代理工程学”（Agentic Engineering）这一新兴学科概念——它在研究对象、控制模型以及人类角色定位等根本维度上，均显著区别于传统软件工程。通过分析近期多项基准实证研究（包括SWE-bench Verified、EvoClaw以及LangChain开展的多代理协同实验），我们既揭示了代理范式所蕴含的变革性潜力，也客观呈现了其当前存在的局限性。最后，我们提出迈向“自演化代理生态”的四阶段发展路线图，并为正在经历这一范式转型的实践者提供具体可行的行动建议。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图解决软件工程范式是否正经历根本性重构这一根本问题——即AI代理（以LLM为推理核心、动态生成/丢弃代码）是否已超越传统软件工程的静态代码逻辑范式，而非仅是自动化增强。这是一个新问题：它不聚焦于如何改进编码效率（如Copilot），而是质疑‘代码作为决策载体’这一50年根基是否已被动摇。
关键思路

提出‘Agentic Engineering’作为新学科，其核心洞见在于形式化区分‘code-as-decision-carrier’（传统软件）与‘code-as-ephemeral-tool’（代理系统）；强调LLM驱动的闭环推理才是第一性原理，代码仅为瞬态执行媒介。新意在于：首次从复杂度缩放第一性原理出发论证范式跃迁，而非经验性对比性能。
其它亮点

1) 引入‘Agent-as-a-Service (AaaS)’历史框架，将SaaS到AaaS定义为复杂性向LLM转移的必然演进；2) 基于SWE-bench Verified（真实GitHub PR修复验证集）、EvoClaw（动态工具调用演化基准）、LangChain多代理协调实验进行三重实证，证实代理在需求漂移场景下成功率提升37%，但失败集中于状态一致性维护；3) 未开源代码（因聚焦概念框架），但所有基准数据与评估协议公开；4) 四阶段 roadmap（人类监督→混合自治→目标自分解→生态自演化）值得深入，尤其第三阶段的‘goal grounding’机制是关键瓶颈。
相关研究

‘The Rise and Potential of Large Language Model Based Agents: A Survey’ (Li et al., 2024); ‘Code as a Foreign Language Revisited: LLMs as Software Engineers’ (Chen et al., ICSE 2024); ‘AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework’ (Microsoft, 2023); ‘Toolformer: Language Models Can Teach Themselves to Use Tools’ (Schick et al., 2023); ‘Reflexion: Language Agents with Verbal Reinforcement Learning’ (Shinn et al., NeurIPS 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问