导语

2025年7月28日,澜舟科技创始人兼CEO周明博士,受邀出席由蚂蚁数科、甲子光年、中国人工智能产业发展联盟、上海新金融研究院联合主办的“驭浪而行 产业向新——智能体驱动产业变革论坛”,同信雅达董事长耿俊岭、未来式智能创始人兼CEO杨劲松、格创东智副总裁李楠、Zand Bank AI与创新负责人吴海山、众安保险首席数据官段朝阳等来自传统金融科技、保险、制造、数字银行一线阵地的多位“实战派”,讨论了企业级AI智能体的“实战情况”。



周明博士表示


“当前,智能体是借助大模型“推理”到“行动”能力推动业务升级的重要方向,但其能力仅处于五级中的“专家级”(第三级),尚未实现自主学习。智能体真正落地需深耕业务场景、肯做“脏活累活”,并通过甲乙双方紧密协作、持续迭代。未来明确看好金融领域的应用落地,澜舟科技也会深耕智能体,聚焦金融领域,引领行业大模型应用,持续提升智能体能力是其释放更大价值的关键。“


以下为本场圆桌对话的文字实录,经「甲子光年」编辑,有删改。

1.经验之谈:AI落地中“坑”与“认知”


王博:今天来的嘉宾都是实战派,聚焦于金融、工业制造等严谨行业。我特别想听听大家在推动AI落地过程中,踩过的最大的是什么?有哪些真实的认知和体会可以分享?

澜舟科技创始人兼CEO周明

周明这个问题很大。我们公司是一家初创企业,已经成立四年了。一开始我们认为大模型或者预训练模型可以解决一切,于是自己做模型。但折腾了半天,大模型突然平权,DeepSeek一出,我们发现自己的模型根本没有多少竞争力——这就是第一个坑。

所以回头来看,创业团队该做什么?我现在的理解是,应该多做一些与具体场景和业务直接相关的事情,少去和大厂拼技术能力和模型能力。

第二个坑是业务层面。虽然我自己懂一些算法和技术,但一进入应用场景,就像掉进一个海洋,完全摸不到边。我们当时做的是会议系统、知识库,属于赋能型产品,我感觉我们一直在业务边缘绕圈走。像前面几位嘉宾在金融场景中的know-how非常深,而我们这些技术创业公司对深层业务是不清楚的。我们只是在边缘绕着,永远接触不到业务最深入的细节,公司也就很容易被大模型公司和大厂碾压。

所以第二个坑是:创业团队如何把自身的技术优势快速转化为业务优势。这就需要像蚂蚁这样的公司,我们要和他们合作,把我们的技术和他们的业务场景快速适配,并调整我们的心态,让我们做的事情真正赋能到业务实际中。

这两个坑我们已经踩过,现在正在快速调整。现在智能体提供了一个新机会:可以把大模型的能力,尤其是后训练能力、强化学习能力,快速赋能到企业各个业务环节中。过去我们靠大数据,如今那些数据已经快被用尽了,而智能体可以将这些数据转化为经验数据,再通过强化学习快速赋能,实现快速迭代,让智能体从简单操作迈向真正能自主助力的阶段。所以我觉得未来有很多值得期待的事情。

信雅达董事长耿俊岭

耿俊岭:我也分享一下我的感受。我们是做金融行业的,到目前为止,尤其在银行业,客户给软件公司的预算还是很有限的,我们其实没有踩过特别大的坑。但从我们自己All-in AI的过程中来看,有两个比较明显的问题。

第一个,是在战略认知上的坑。2021年刚出现大模型的时候,开复老师就来杭州和我们交流,但当时我们并没有足够的认识,觉得这怎么可能?结果就错过了最早的R1-R3阶段探索。后来GPT出来,我们才出了一身冷汗。

我们公司从1996年就开始做OCR,有非常深的AI基因,所以当时就决定:我们必须要迎接这个变革。这既是我们的擅长,也是我们的基因。我们从2023年开始加大投入,但在过程中又犯了第二个错误:我们以为底层算法和模型能力不需要我们做,只要把应用做好就可以。

当时公司有6000名技术人员,我们认为只要大家有热情,迎接这个趋势,专注做好应用就够了。但实际上,大模型处于一个蹒跚学步、非常陡峭的发展期,整个团队在产品、技术上的认知都跟不上。所以2023年我们没有取得什么成果。

2024年我们痛定思痛,在人才方面加大投入。我们请来了很多人才,包括来自阿里、百度、金融行业的专业人士。我们的CTO团队从原来的一人变成了“一正四副”的结构,全部都是AI方面的资深人员。同时,我们还战略性收购了建行旗下的一家公司,这家公司就是为AI而生,用了五年时间积累了非常扎实的AI能力和产品能力。

这些都是我们在认知不足的情况下,为了补课而采取的行动。这个技术本身陡峭得超出想象,只有真正建立起系统的认知,才能走得更远。

格创东智副总裁李楠

李楠:我们是做制造业的,可能和金融行业相比,数据的完整性更差。我们现在遇到最大的坑,就是数据问题。我们更多是做小模型,通过对数据的时序分析建立模型,可以比较快速地搭建出小模型系统。但到了大模型时代,就发现情况完全不一样。

哪怕是中国最顶尖的制造业企业,已经建立了数据中台,问题依然很多。比如A、B、C三个工厂生产的产品是一样的,但因为负责人不同,质量主管不同,对每个数据指标的定义、计算逻辑都不一致。面对我们开发的智能体系统时,由于质量体系和数据标准不统一,在实际落地中就会遇到非常大的挑战。

去年我们做了一个比较大的智能体项目,派了很多硕士、博士去做算法,结果他们到了现场,做的大部分工作其实是数据治理。这块可以说是我们目前遇到的最大困难和挑战。

Zand Bank AI与创新负责人吴海山

吴海山:我们在银行领域,主要负责构建针对银行垂直业务的Agent系统。我们用了很多不同的模型,也踩了不少坑。前段时间我看到一位科学家写的一篇文章,讲他们在开发过程中遇到的坑,我觉得和我们遇到的几乎一模一样。我总结了几个关键点和大家分享。

第一,我们的一个经验,也可以说是教训,与刚才甲子光年报告中的观点有所不同。我们认为模型本身是最重要的,因为模型决定了Agent能力的上限。开发初期一定要先用最好的模型来测试Agent的表现,这样才能判断问题到底出在上下文工程,还是模型能力本身不到位。尤其是在一些复杂任务场景下,比如编程领域,这种差异特别明显。

第二点,在开发Agent的过程中,一定要预判半年到一年之后模型能力的提升幅度。我们在做文档分析时,用了很多传统方案,虽然训练出来的模型结果有一定“幻觉”,但我们预判半年或一年之后,这种任务一定会成为主流。因此我们果断调整了整个技术路径,修改了所有文档处理的方式。不管是用国内的千问,还是其他大模型,这一步帮助我们大幅度降低了后续成本。

这两个坑,是我们感受最深的:一是模型非常关键;二是要对基座模型的发展节奏有清晰的判断力,提前布局。

众安保险首席数据官段朝阳

段朝阳:从应用的角度看,也许是过度乐观,或者说是压力促使,我们一度以为可以快速推动AI的落地。但这种压力反而带来了抵触情绪,很多问题被激化了,没能得到很好的解决。所以我们希望能建立一个更良性的反馈机制。比如说我们从最开始AI系统的错误率大概是7%,通过不断优化,现在已经降到千分之七,甚至万分之七。今天我们的前线营销员工真的非常喜欢用AI,最直接的体现就是他们的收入有了大幅提升。

我们是互联网保险公司,数据基础设施做得相对比较好,AI一上线就能快速在多个场景中进行大规模应用。但我们也发现,原来为数据科学家设计的数据架构,在AI时代还远远不够。

以前的数据系统会有多重交叉验证,能确保最终结果的可靠性,但大模型环境下,整个数据架构必须做非常大的调整。为此我们特别打造了一个叫“航海图”的数据产品,它不仅面向数据科学家,也面向AI和模型开发者,提供更高效的数据调用能力,在保证时效性的同时也提升了准确性。

未来式智能创始人兼CEO杨劲松

杨劲松:我们一开始遇到的,是一个比较典型的大坑。很多企业会希望整个流程都可以实现自动化,甚至完全由智能体承接整个链条。但其实这是一个比较大的误区。

至少目前来看,大模型和Agent技术仍处在发展的相对早期阶段。如果我们一开始就为了追求最后1%的自动化极致效果,那在现实中,不管是从成本还是可实践性来看,差距都非常大。

我们在后续实践中发现,一个更可行的方式,是把Agent和人结合起来,构建一个新时代的知识工作流水线。它的核心思路是,把原有的工作流程拆解开,把那些机器更擅长的任务交给Agent来做,而人则作为协作方进行补充。

就像是在搭建一个“人+Agent”协同的新流水线。通过这种方式,工作效率可以提升2到5倍,虽然达不到我们说的“百倍提升”,但它是一个更接近实际落地的方案。

现在我们在多个行业做的事情,就是搭建这样一套融合系统:人和Agent协作的工作台。Agent会先完成一些基于既有SOP流程、数据量大的任务,给出一个初步结果;人再作为检查者判断Agent的输出是否精准,是否可以推进到下一步;最终由人来决定是否提交。这种模式可以更快地投入到实际生产中,效果也更好。

随着使用过程中的数据不断积累,我们也会将用户产生的数据反馈到模型中,通过微调的方式,让Agent不断升级,叠加能力,进入一个更成熟的状态。我认为这是一条在产业中更可行、更现实的落地路径。

2.实战解密:智能体应用中的真问题


王博:我们行业里看到很多人在拍视频演示各种智能体,看上去都很炫。想问下周明老师,你们是如何向客户证明自己的智能体不是PPT、不是Demo,而是真正可以实战、能够落地的产品

周明确实,现在智能体是个热点。它背后核心就是大模型的能力,大家都觉得从“理解”到“推理”再到“行动”是大模型的演进路径,而智能体就是这个路径上的阶段性成果。所谓智能体,其实说的是“代理能力”,再往后还有“创新能力”和“组织能力”。现在AGI大概就走到“智能体”这个阶段了。但我想强调的是:目前的智能体,能力还很初步。

我自己把智能体能力分为五级:

1.简单对话 

2.推理能力 

3.专家级别 

4.自主学习 

5.能和物理世界互动的具身智能

现在我们基本处在“第三级”,也就是专家级水平,还远没到自主学习的阶段。大家都期待未来会出现能自己学习、自主成长的智能体,但现实是,现在还做不到。目前,大多数智能体就是一个大语言模型的具体应用,稍微进阶一点,是能够完成一些任务、自动执行操作。但要真正落地,还得回归业务实际。这就回到你的问题:

你必须要非常了解业务场景、非常懂数据,脏活、累活都得自己干。不是拿几个Agent、堆几个组件和流程,就能上线交付给客户。那种做法也许可以拿来做POC、做获客,但一旦涉及实际交付,很容易露馅。要让智能体真正落地,就必须把业务场景和Agent组件有机组合起来。甲方乙方必须密切协作,通过多轮迭代,才能真正“用得起来”。

我们愿意做这个过程中最先尝试的人,虽然很辛苦、成本很高,但希望通过打造几个标杆项目,为后面的智能体应用和行业场景打下基础,加快整个行业的创新速度。

总结一下就是以下三点:

1.要有清晰的技术和业务认知;

2.要愿意做脏活累活苦活;

3.不断提升智能体能力,未来才有可能释放更大的价值。

王博:杨总刚刚提到人和Agent之间的判断和决策问题,什么时候应该是人来做决策?什么时候应该交给Agent来判断?

杨劲松:实际上,在一些企业场景中,会涉及到大量所谓“企业上下文”的内容,这时候人的参与会更合适。我们在构建智能体的时候,会尽量把企业的上下文知识注入进去,但这些信息并不是通过文字就能完整表达的。有些情况非常依赖经验判断或者组织内部的默会知识,这时候由人来做判断,会更有帮助。

王博:刚刚听李总谈到,数据问题不仅仅是多模态的问题,更重要的是原始数据是否清晰,以及后续治理的能力。那你们现在有没有更好的方式,帮助数据变得更标准化、更可用?

李楠:这是一个基本功的问题。我们现在更多采取的做法是,让大数据团队先进入企业,从顶层设计开始,帮他们构建指标体系。从指标体系往下搭建一整套数据基础和数据标准,然后再把数据按照正确方式清洗,最后提交给业务或模型开发团队。通过这种方式,后面的问题就会少很多。

王博:我相信今天在场也有很多观众关注“出海”的问题。吴总,你在阿联酋这边有很多出海经验,能不能聊聊在海外遇到过哪些“坑”?

吴海山:阿联酋有一个很大的优势,就是它对芯片使用没有限制,各种模型都可以跑。另外一个特别明显的优势是,用户的付费习惯非常好。我之前也在国内银行工作,对国内企业的痛点比较了解。国内很多AI公司产品做得真的非常好,但在C端几乎很难收费,我看到有一家创业公司做得非常优秀,但收费转化率不到1%,这让人非常遗憾。

再一个,企业客户的付费意愿也不强。很多企业更愿意为看得见摸得着的硬件付费,但对软件的价值认知还不够。所以在阿联酋包括整个中东地区,企业和个人的付费意愿非常强,这对中国企业是个很好的机会。我建议,中国很多面向C端的好产品、好技术,可以加快出海节奏,特别是往中东、阿联酋这样的国家走。我们也很愿意做一个桥梁,把这些优秀的技术和产品带到国际市场。


3.前瞻洞察:行业智能体赋能新格局


王博:今天圆桌最后一个问题,想请各位预测一下:到明年,你认为哪个行业的智能体最有可能实现大规模落地应用,并真正创造价值?

周明首先,金融行业的落地是没有问题的。其次,我看好AI for Science这个方向。AI可以帮助科研人员做调研、发明、定理证明,甚至撰写论文。整个过程的效率将会被大幅提升。

段朝阳:从行业角度来看,我一直从事金融行业。金融本质上是一个经营风险的行业,而风险是由数据刻画的,AI正是通过应用数据来刻画风险的刻刀。因此我相信,AI在金融行业的应用将会表现得非常突出。

我认为另一个比较明显的方向是智能驾驶,也就是智能出行。这个判断可能比较大胆,但我认为值得关注。

吴海山:我认为到2027年,最有可能被取代的就是初级程序员。我刚刚看到一则新闻,说编程能力又有了大幅度的提升。我们在开发过程中发现,真正的编程环节中,80%的tokens其实都是消耗在编码上。如果AI继续以这样的速度发展,初级程序员大概率就不需要了。但像架构师这样的角色仍然非常重要。

目前我们使用AI进行编程,通常是先做架构,再写程序,能实现至少80%以上的代码自动生成。不像外界担心的那样会泄露数据,只要做好架构设计和代码分析,是完全可以达到生产级效果的。所以我认为到明年,初级程序员可能就不存在了。

李楠:从制造业来看,最有可能率先落地智能体应用的,是半导体和汽车制造这两个大行业,因为它们的自动化和信息化水平相对比较完备。而其他行业,当前最重要的任务是先补齐数据的短板,数据问题解决之后,其他应用才能有效推进。

杨劲松:我认为可以从三个维度来判断哪些行业更容易落地智能体:一是高度标准化,二是高频发生,三是低复杂度。按这个逻辑推演,未来几年或已经开始落地的行业,首先是客服,市场营销,现在发展到初级Coding这样的方向。

耿俊岭:当前存在大量重复性强、规则清晰的岗位,这类作业人员在整体岗位中占比很高,也最容易被取代。就像这次峰会中提到的,制造行业很可能会率先实现大规模的“机器化人”。

查看原报道请点击“阅读原文”

(封面图及文中图片来源:2025世界人工智能大会“智能体驱动产业变革论坛”)

关于澜舟科技

ABOUT


北京澜舟科技有限公司(简称澜舟科技)成立于 2021 年,是一家业界领先的认知智能公司,致力于以自然语言处理(NLP)技术为基础,为全球企业提供新一代认知智能平台,助力企业数字化转型升级。


澜舟科技专注垂直领域、专业赛道,深耕智能体,聚焦金融领域,引领大模型行业应用,其主要产品是基于大模型技术为企业提供智能体(Agent)及数字员工应用产品及服务。

图片


商务洽谈👇


图片

往期文章推荐

澜舟科技官方网站

https://langboat.com

获奖与新闻

新品发布|澜舟智能助手:高效管理知识,精准搜索问答

澜舟智会再升级|企业用户与专业人士的智能会议助手

澜舟科技获批北京市专精特新中

HICOOL 2021创业大赛一等奖 | 周明博士专访


 

技术专栏一览

tDRO:面向大模型稠密检索的任务级分布鲁棒优化

澜舟科技新突破:大模型实现“持续学习”

澜舟智库AI文档辅助写作

孟子3-8B开源孟子3-13B开源


澜舟科技公众号
图片

期待您的关注:)

内容中包含的图片若涉及版权问题,请及时与我们联系删除