- 简介自主式人工智能代理正开始在开放互联网上跨组织边界运行——自主发现其他方所拥有的代理、与之开展交易,并将任务委托给这些代理,整个过程无需中心化监管。当来自不同人类委托人的代理大规模协同工作时,其整体行为将变得不透明:没有任何单一个人能够完整观察、审计或治理由此涌现的复杂行为。我们将这一现象称为“逻辑垄断”(Logic Monopoly)——即代理社会在从规划、执行到评估的全部逻辑链条上所形成的、不受制约的垄断性控制权。为此,我们提出“权力分立”(Separation of Power, SoP)模型:一种部署于公有区块链之上的宪制化治理架构,通过三项结构性分立机制打破上述垄断——代理以智能合约形式制定运行规则(立法权),确定性软件在合约框架内执行具体操作(行政权),而人类则通过一条完整的权属链对代理行为进行裁决与追责(司法权),确保每个代理均可追溯至一位负有最终责任的人类委托人。在此架构中,智能合约本身即为法律——它既是代理产出的实际立法成果,也是规范其自身行为的根本准则。我们在基于EVM兼容的二层区块链(L2)构建的AgentCity平台上实现了SoP模型,采用三层智能合约层级结构(基础层、元层与运行层)。本方案的核心主张是“以可问责性实现对齐”(alignment-through-accountability):只要每个代理均通过明确的问责链条与其人类所有者保持对齐,则整个代理群体便能自发收敛于符合人类意图的行为模式,而无须依赖自上而下的强制性规则。一项预先注册的实验在“公共资源生产型经济”场景中对该主张进行了验证——在此场景中,代理共享一个有限的资源池,并协同创造价值;实验规模覆盖50至1,000个代理。
-
- 图表
- 解决问题论文试图解决自主AI代理在跨组织、去中心化互联网环境中大规模协作时产生的‘逻辑垄断’问题——即代理社会在规划、执行、评估全链条上形成无人可审计、不可治理的黑箱集体行为,导致人类失去对AI系统行为的可观测性、可问责性和可控性。这是一个新兴且紧迫的问题,随自治代理实际部署(如AI agent networks、B2B agent marketplaces)加速浮现,此前缺乏系统性治理框架。
- 关键思路提出‘权力分立’(Separation of Power, SoP)宪法式治理架构:将代理社会的逻辑链强制解耦为三权——代理通过智能合约‘立法’(定义规则)、确定性软件‘行政’(执行合约)、人类通过完整所有权链‘司法’(裁决争议)。核心创新在于将智能合约本身视为‘法律’(而非仅工具),并要求每个代理必须锚定至可追溯、可追责的人类所有者,实现‘对齐通过问责’(alignment-through-accountability),摒弃依赖全局指令或中央协调器的旧范式。
- 其它亮点首次在EVM兼容L2链(AgentCity)上实现三层智能合约层级(基础/元/操作)的SoP实例;实验设计为预注册的‘公地生产经济’场景(共享资源池+协同价值创造),规模覆盖50–1,000代理,聚焦可复现的集体对齐涌现;强调‘所有权链’(ownership chain)作为问责基础设施,是技术-法律接口的关键工程突破;暂未提及其开源代码状态,但架构设计明确支持开放验证;值得深入的方向包括:跨链所有权继承机制、人类 adjudication 的规模化人机接口(如DAO-based courts)、SoP在现实API经济中的合规映射。
- ‘The AI Constitution: A Framework for Aligning Autonomous Agents with Human Values’ (Bender et al., 2023); ‘Decentralized AI Governance via Blockchain-Enforced Social Contracts’ (Zhang & Park, ICML Workshop 2024); ‘Agent-to-Agent Protocols: Towards Open Multi-Agent Economies’ (Rahwan et al., AAAI 2024); ‘On the Emergence of Norms in LLM-Based Agent Societies’ (Park et al., NeurIPS 2023); ‘Verifiable Autonomy: Auditing LLM Agents via On-Chain Provenance’ (Chen et al., USENIX Security 2024)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流