
当AI智能体不再仅是执行指令的工具,而是成为主动协作、调度服务的数字实体,智能体的崛起正悄然改写互联网的底层逻辑。
当为“人机交互”而生的互联网体系,不再能承载智能体时代的要求,下一代互联网形态该走向何处?在这一关键转折点上,常高伟以其在通信与互联网领域的深厚积淀,正全力推动一种答案:由开放协议连接的、真正互联的智能体互联网(Agentic Web)。
本次智源采访,我们对话了ANP开源社区发起人、W3C AI Agent protocol CG联合主席常高伟。作为拥有十年通信行业沉淀与八年互联网实战经验的资深技术专家,他曾主导淘宝直播、阿里云实时媒体网络等核心协议设计,更是国内较早探讨Agentic Web理念的先行者。如今,他全职深耕智能体协议领域,致力于以协议为基石,推动Agentic Web愿景落地,构建开放的智能体互联网生态。
本次对话中,他直言“Agentic Web才是真正的Web 3.0”,未来互联网将为智能体而设计,软件会被通用智能体取代,中介平台的价值或将被颠覆。他精准拆解智能体交互的三大痛点——身份互认、智能体发现、能力描述,更预判到开放生态与封闭生态的终极竞争,正成为行业未来的关键命题。
采访:李梦佳 编辑:陈然、关丽娜
要点速览
智能体网络的最优解:未来的智能体网络必然是一个开放生态,而非当前由超级APP主导的数据孤岛。实现智能体开放互联的最佳方式就是“协议”。智能体之间高效、可信的交互必须依赖一套标准化协议体系,这将是驱动生态繁荣的技术根基。
真正的Web3.0:专为AI设计的下一代互联网Agentic Web才是真正的Web3.0。它并非取代HTTP,而是在其之上构建智能体间的业务层协议,以解决身份、发现、描述与授权等核心问题。未来互联网将从“为人设计”转变为“为AI服务”。
通用个人助理颠覆未来:通用个人助理将是智能体生态的首个颠覆性体验,更是Agentic Web落地的关键入口。用户无需在无数APP间切换,一个通晓一切的智能体即可调度所有服务。这种交互范式的转变,将直接重塑互联网的服务结构与流量分配方式。
未来之争=生态之争:未来竞争的本质,远非普通的产品竞争,而是两种生态模式的博弈较量。一方是超级APP竭力维护的封闭花园,另一方则是以智能体协议为基石构建的开放生态。破局的关键在于通过开源、中立的协议,构建一个让智能体自由、低成本协作的开放网络,打破垄断,释放AI生产力。
01
深耕通讯行业十年,投身智能体互联生态建设
“最核心的原因,就是我一直认为智能体互联网应该是开放的”
采访者:您从阿里巴巴高级技术专家到 ANP 开源社区发起人、W3C AI Agent protocol CG 联合主席,职业路径始终聚焦技术前沿,是什么样的行业观察或个人经历,让您坚定地投身智能体协议这一领域?
常高伟:我一直清楚,做这件事想成功非常难。毕竟开源社区的影响力和相比大厂是有差距的。如果在A2A推出之后,我大概率是不会做这件事的,因为我知道其中的难度。但我们的优势在于,A2A推出时我们已经做了一年,技术特征也和A2A有很大差异。考虑到沉没成本,中途放弃太可惜,就坚持了下来。目前来看,这个决定是值得的——就目前来看,我们的ANP与A2A、MCP依然保持了明显的差异性,并且在某些领域,比如智能体身份的探索,ANP是明显更加的领先。
决定做这件事,最直接的原因是我的职业经历。我最早在通信行业待了十年,之后进入互联网行业,在阿里工作了八年。这几年时间里,我基本都在做协议相关的开发——既有通信行业的协议,也有互联网领域的直播和音视频协议。淘宝直播底层用的协议,阿里云的实时媒体网络协议是我主导设计的。包括我们熟知一些超级APP应该都都有用过我设计的协议。
我做协议的时间久,又有通信和互联网两个行业的经验,我一直以来都在思考一个问题:为什么通信行业,像移动和联通的用户,能互联互通,而号称更加开放的互联网产品,像钉钉和微信,却彼此隔离?之前我也做过简单尝试,比如搭建过一个类似个人门户的网站,但最后没完全做起来。直到AI出现,让我看到了智能体对开放性的需求。
因为AI只有掌握了人的上下文,才能更好地帮助人做决策,所以AI天生就需要把人的上下文汇聚到一个点上,只有这样才能充分释放AI的潜力。但当前整个互联网是由一个个数据孤岛组成的,彼此之间不互联互通。这时候,传统互联网的生产关系,就成为了AI这种先进生产力发展的阻碍。2024年4月份,结合我一直做协议的技术经历,我突然意识到,协议在未来会成为AI或智能体的重要基础设施。当时我有个核心判断:未来的智能体之间肯定是开放互联的,未来的智能体互联网也必然是开放生态,而不是现在这样的封闭生态。开放生态就需要智能体之间的交互,而交互的最佳方式就是协议。
正是基于这个考虑,我在2024年4月份开始做这个开源项目,着手设计方案。当时我还在阿里,用了一两个月的时间调研思考,觉得这件事可行,之后就从阿里离职,全职投入这个开源项目。
最开始做的时候特别难,整个行业里了解协议的人不多,知道智能体为什么需要协议的人就更少了,要把这个逻辑讲清楚需要很长链路,不一定所有人都能听懂。我们做了半年之后,MCP推出了。MCP推出后就好很多,至少不用再解释“协议是什么”了;后来谷歌A2A推出,连“智能体之间交互为什么需要协议”也不用多解释了。到现在,协议的发展速度很快,进展也很顺利,比如最近MCP已经捐赠给开源基金会了。这期间我们还获得了W3C的支持,在W3C成立了智能体协议社区组;另外,我们和华为、中国移动、联通、电信等国内大厂合作,在IETF提交过智能体协议草案,也和很多其他企业在这一领域有合作。
总结来说,我做这件事最核心的原因,就是我一直认为智能体互联网应该是开放生态而非封闭生态,而开放生态必然需要协议支撑。所以我们社区的核心理念是“开放的智能体互联网”,核心产品就是协议。我们社区应该是全球最早研究智能体互联网的开源社区之一。

采访者:在您丰富的行业经历中,观察到智能体交互有哪些期待解决的痛点场景吗?
常高伟:最早做协议的时候,我就设想过一个场景。如果未来每个人都有智能体,我和你之间要开视频会议,最好的方式是什么?如果你用的是阿里的智能体,我用的是腾讯的,我们可以通过网络协议交换音视频数据。彼此的智能体在背后读取各自的数据,帮我们做记录、分析和总结。从这个场景就能看出,用协议是解决问题是最好的。然而,要实现这件事需要解决几个核心痛点问题。
第一个问题,智能体身份的问题,不同公司开发的智能体如何互认?第二个问题,智能体发现的问题,我的智能体如何找到你的智能体?第三个问题,智能体描述的问题,智能体找到对方之后,假设我们要开音视频会议,双方的智能体如何知道彼此支持哪些音视频格式并进行媒体协商?智能体的身份、发现和描述,我一直认为是智能体协议的三大核心组件,用来解决行业内智能体交互的核心痛点。
当然还有其他问题,目前行业内还没有很好的解决方案,比如智能体的授权问题。豆包手机的出现也让这个问题浮现出来,比如智能体要操作企业APP,它是否获得了人的授权?如果我让智能体帮我购物,商家怎么确认智能体已经获得了我的授权?智能体授权的痛点,目前整个行业还没有更好的解决方案,我们社区探索中。

图注:英国《New Scientist》杂志报道ANP开源社区
02
如何锚定Agentic Web 为真正的 Web3.0?
“未来的互联网,应该是为智能体设计的。”
采访者:之前的报道里有个比喻,ANP的目标是成为智能体互联网时代的HTTP。您能不能再深度解读一下这个比喻?在您看来,ANP在智能体世界中想要扮演的角色,是不是就像HTTP在网页世界中那样?
常高伟:对,这是一个比喻,之前也有人把MCP比作智能体的HTTP。我们认为,整个互联网之所以能繁荣,和HTTP有很大关系。我个人也非常崇拜HTTP的作者——Tim博士,他很有远见,而且具备很强的开源和开放精神。
关于ANP在整个互联网中的作用,它并不是要取代HTTP,而是一个类比。ANP是构建在HTTP协议基础之上的。之前的互联网是基于HTTP构建的,而未来的智能体互联网,肯定要基于一个智能体协议来构建。为什么HTTP适应不了未来的智能体互联网?因为HTTP本质上是偏传输层的、业务无关的协议,更多解决的是传递数据的问题。而智能体交互则是更上层的问题,比如两个智能体之间的如何进行身份认证、如何描述信息,乃至预定酒店时描述信息如何传递、如何进行支付,这些问题HTTP并没有解决。
因此,在传统协议四层架构中,HTTP在应用层。我们认为,未来应该在应用层基础之上再增加一层业务层,这就是MCP、A2A和ANP目前在做的事情。它们是和业务紧密耦合的协议,比如用什么协议让智能体之间协作帮人完成预定酒店、点外卖、买火车票等任务?这就是ANP的定位。我认为我们在定位上与MCP、A2A是非常类似的。

图注:AI agent
采访者:我们也注意到,您曾提出过Agentic Web(为AI设计的下一代互联网)这个概念,能否再详述一下这个愿景?以及通过ANP您想实现的目标,或是通过什么样的智能体协作,能够改变普通人的生活或企业的运作模式?
常高伟:关于Agentic Web,我们去年底就探讨了这个概念,是国内比较早关注这一问题的团队。今年年中微软在发布会上也提及了这个概念。包括在智能体支付上,我们社区在六七月份提出的相关方案,与谷歌在九月发布的AP2协议高度相似。这足以印证我们社区在理念和技术上的前瞻性。
我们认为,Agentic Web才是真正的Web3.0。关于Web3.0,行业内已经讨论探索过很多方向,比如HTTP的作者Tim博士,就曾提出过语义网的概念。语义网的核心是把整个互联网通过数据标注的方式变成一个机器可读的网络,但这个方案因依赖高成本数据标注并受限于当时AI能力不足,最终效果不佳,未能普及。而基于区块链的Web3则受限于区块链的扩展性问题,虽然在金融领域找到了产品市场契合点(PMF),但在互联网领域并没有大规模应用。我们现在能清晰地看到,下一代Web3.0,将是Agentic Web,即智能体化的Web。
具体来说,之前的互联网都是为人访问设计的,比如人看APP、看网站,都需要通过UI界面。而未来的互联网,应该是为智能体设计的,人使用智能体访问互联网,而不需要在使用一个UI或网站。这个网络我们称作AI原生的数据网络,即专门为AI设计的互联网。
传统的APP和Web为人使用而设计,要让AI处理APP或网站,目前主要有两种技术方案:一种是Phone Use方案,让AI操作PC或手机,比如最近很火的豆包用的就是这种技术,但这种技术最大的问题是成本较高,一来需要AI实时处理视频信息,二来受限于操作系统,无法同时处理多个任务;另一种是AI浏览器方案,让AI直接读取网站代码并理解内容,但网站代码里包含很多为渲染页面生成的文本信息,比如HTML和CSS布局相关内容,这些信息对AI来说没有价值,造成token的浪费。
这就回到了我们对Agentic Web的核心认知:在Agentic Web中,智能体通过协议的方式,为其他智能体提供服务,无需UI,而是直接提供最底层的数据。
如果Agentic Web成为现实,会对整个互联网结构产生重大影响。我们之前总结过Agentic Web的三个趋势:第一个趋势是,未来软件大概率会被智能体取代,每个人都可能拥有一个通用个人助手;第二个趋势是在连接层面,如果企业拥有自己的智能体,那么人与企业/商家交互时,就不需要再到现有的平台上去寻找企业/商家。比如现在订酒店需要打开各种APP,未来个人智能体和酒店智能体可直接协作,没有中间商,交易链路最短,现有平台的中介价值可能被颠覆;第三个趋势是,未来智能体之间通过协议交互,必然会出现标准化的智能体协议。
具体到对普通人的影响,我们认为未来人们不需要再下载很多APP,拥有一个通用智能体,再加上少量垂直领域的智能体就足够了,很多事情都可以让智能体帮忙完成。这也是我们社区一直以来描绘的智能体互联网蓝图,以及人们访问互联网方式的未来图景。
03
超级 APP 封杀背后的开放 vs 封闭生态之战
“怎么从现有的商业化形态中走出来,孕育、诞生出真正适合AI的生态,阻力是非常大的。”
采访者:那您觉得距离实现这个蓝图,从技术层面还有哪些需要解决的问题?过程中还会有哪些瓶颈和挑战?
常高伟:我从技术和商业两个方面来谈这个问题。先看技术角度,第一个技术瓶颈是协议。协议是Agentic Web或者未来智能体互联网非常重要的基础设施,现在相关协议已经有很多了,但目前行业仍没有达成强共识。未来需要进一步推动标准化协议的共识,以降低整个生态的连接成本。此外,协议中如智能体的授权、支付等关键问题也需要关注和解决。对此,我们社区与很多同行一直在协议相关的前沿领域做探索。
第二个技术瓶颈是模型限制。目前模型在复杂任务的推理能力上表现不错,但成本和速度仍是瓶颈。比如模型Token成本问题:如果让智能体帮我买东西,可能商品本身只要9块9,但Token成本就要一两块,成本较高,还需进一步降低。第二个是模型处理速度问题:我们曾经基于协议跑通过一个订酒店的案例,用Manus查找酒店大概要2分钟,用我们的协议大概花1分钟,虽然已经提速一倍,但这1分钟仍然很长,还需要再降低几倍甚至一个数量级。
再看商业层面,阻力可能会更大。构建一个能帮人做很多事、同时能触达人所有上下文的个人助手,这个个人助手很有可能会触犯当前超级APP的核心商业利益。所以,怎么从现有的商业化形态中走出来,孕育、诞生出真正适合AI的生态,阻力是非常大的。我们可以看到行业正在发生的现象,现有的超级APP都在致力于构建一个封闭的智能体生态,从封闭到开放的过程中,商业是最大的阻力。
虽然现在超级APP对智能体的封杀让我们看到了商业阻力的严峻,但我认为未来或许可以走新的路径培育开放生态——直接基于智能体协议构建一个全新的AI生态,而不是基于传统的超级APP构建AI生态。比如,企业会构建自己的智能体、个人侧也有智能体,它们可以通过协议直接连接,而不用受制于超级APP,同时企业和个人还可以获得更低的连接与交易成本。
我认为,未来生态最大的竞争,将会是“以超级APP为核心的封闭生态”和“以协议为核心的开放生态”之间的激烈竞争。未来会很精彩,竞争不再单单是阿里、腾讯、字节这些巨头之间的竞争,更是开放生态和封闭生态的竞争。会有很多企业更加看好开发的生态,特别是当前没有完整生态的公司,比如AI手机、AI邮件、大模型、创业公司。
我们相信在未来胜出的一定是开放生态,其中的第一性原理是:只有开放的生态才能够是否AI的潜力(让AI获得完整的上下文,获得调用现实世界的能力)。
采访者:那您觉得对于普通人而言,智能体生态首先带来的、类似ChatGPT时刻那样的颠覆性体验,可能会出现在哪个生活场景中?是豆包这样的个人助理,还是医疗健康领域,或者其他方面?
常高伟:如果要加上“颠覆性”这个前缀,我认为应该是类似豆包助手这样的通用个人助理。很多人在实际操作过之后都会感到惊叹,虽然它在操作APP等方面的体验还不够完善,但它已经让人看到了未来的形态。所以我认为,通用个人助理才是能真正带来颠覆性体验的产品。
采访者:关于社区建设层面,您作为开源社区发起人,如何激励全球的开发者为这个底层协议做贡献?以及ANP社区如何保持活力和开放性?
常高伟:这涉及社区运营和社区治理两个问题。关于社区治理问题。我们创立第一天就明确,协议不能做商业化,否则在互联网领域肯定没有发展空间。因此我们承诺社区将始终保持开放、中立、非营利。我个人以及我们团队的早期相关成果,都承诺会完全捐赠出来,永远不收费。
目前在开放性和社区治理上,我们现在核心的工作就是推进将ANP捐赠到一个开放中立的开源基金会。现在我们已经对接了国内外各大开源基金会,计划在近期确定捐赠对象,将成果完全免费捐赠出去。现在整个社区的核心知识资产还在我名下,后续会完成捐赠,未来在基金会框架下进行更开放、中立、非营利的治理,不被任何公司控制,这一直是我们社区追求的目标。
关于社区运营问题。说实话,在做ANP之前,我没太多社区治理相关的经验,一路也在摸索。目前社区的核心成员还是以国内为主,社群规模大概有1700人左右,社区builder接近300人,贡献者接近100人。整体来看,我们社区的力量还不算大。
这些社群成员和社区建设者之所以选择加入,最主要的是认可我们主张的“开放的智能体互联网”理念。至于如何让更多人了解我们的理念,我们主要靠社区的公众号文章,以及各种开发者大会、开发者交流活动和线上直播等场合,宣传、讲解、分享我们的技术和智能体互联网理念。关于如何激励他们,我自觉还有很多需要学习的地方。现在我们已经有不少贡献者,但依然在期待和欢迎更多伙伴的加入。(开源项目链接:https://github.com/agent-network-protocol/AgentNetworkProtocol)

图注:ANP官网(https://agent-network-protocol.com/zh/)
采访者:社区最终想要实现的愿景是什么样子?


当数据见顶,AI的下一次跃迁靠什么?刘子纬给出“第二条增长曲线”丨智源专访
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢