导语

2025年7月28日，澜舟科技创始人兼CEO周明博士，受邀出席由蚂蚁数科、甲子光年、中国人工智能产业发展联盟、上海新金融研究院联合主办的“驭浪而行产业向新——智能体驱动产业变革论坛”，同信雅达董事长耿俊岭、未来式智能创始人兼CEO杨劲松、格创东智副总裁李楠、Zand Bank AI与创新负责人吴海山、众安保险首席数据官段朝阳等来自传统金融科技、保险、制造、数字银行一线阵地的多位“实战派”，讨论了企业级AI智能体的“实战情况”。

周明博士表示，

“当前，智能体是借助大模型“推理”到“行动”能力推动业务升级的重要方向，但其能力仅处于五级中的“专家级”（第三级），尚未实现自主学习。智能体真正落地需深耕业务场景、肯做“脏活累活”，并通过甲乙双方紧密协作、持续迭代。未来明确看好金融领域的应用落地，澜舟科技也会深耕智能体，聚焦金融领域，引领行业大模型应用，持续提升智能体能力是其释放更大价值的关键。“

以下为本场圆桌对话的文字实录，经「甲子光年」编辑，有删改。

1.经验之谈：AI落地中“坑”与“认知”

王博：今天来的嘉宾都是实战派，聚焦于金融、工业制造等严谨行业。我特别想听听大家在推动AI落地过程中，踩过的最大的“坑”是什么？有哪些真实的认知和体会可以分享？

澜舟科技创始人兼CEO周明

周明：这个问题很大。我们公司是一家初创企业，已经成立四年了。一开始我们认为大模型或者预训练模型可以解决一切，于是自己做模型。但折腾了半天，大模型突然平权，DeepSeek一出，我们发现自己的模型根本没有多少竞争力——这就是第一个坑。

所以回头来看，创业团队该做什么？我现在的理解是，应该多做一些与具体场景和业务直接相关的事情，少去和大厂拼技术能力和模型能力。

第二个坑是业务层面。虽然我自己懂一些算法和技术，但一进入应用场景，就像掉进一个海洋，完全摸不到边。我们当时做的是会议系统、知识库，属于赋能型产品，我感觉我们一直在业务边缘绕圈走。像前面几位嘉宾在金融场景中的know-how非常深，而我们这些技术创业公司对深层业务是不清楚的。我们只是在边缘绕着，永远接触不到业务最深入的细节，公司也就很容易被大模型公司和大厂碾压。

所以第二个坑是：创业团队如何把自身的技术优势快速转化为业务优势。这就需要像蚂蚁这样的公司，我们要和他们合作，把我们的技术和他们的业务场景快速适配，并调整我们的心态，让我们做的事情真正赋能到业务实际中。

这两个坑我们已经踩过，现在正在快速调整。现在智能体提供了一个新机会：可以把大模型的能力，尤其是后训练能力、强化学习能力，快速赋能到企业各个业务环节中。过去我们靠大数据，如今那些数据已经快被用尽了，而智能体可以将这些数据转化为经验数据，再通过强化学习快速赋能，实现快速迭代，让智能体从简单操作迈向真正能自主助力的阶段。所以我觉得未来有很多值得期待的事情。

信雅达董事长耿俊岭

耿俊岭：我也分享一下我的感受。我们是做金融行业的，到目前为止，尤其在银行业，客户给软件公司的预算还是很有限的，我们其实没有踩过特别大的坑。但从我们自己All-in AI的过程中来看，有两个比较明显的问题。

第一个，是在战略认知上的坑。2021年刚出现大模型的时候，开复老师就来杭州和我们交流，但当时我们并没有足够的认识，觉得这怎么可能？结果就错过了最早的R1-R3阶段探索。后来GPT出来，我们才出了一身冷汗。

我们公司从1996年就开始做OCR，有非常深的AI基因，所以当时就决定：我们必须要迎接这个变革。这既是我们的擅长，也是我们的基因。我们从2023年开始加大投入，但在过程中又犯了第二个错误：我们以为底层算法和模型能力不需要我们做，只要把应用做好就可以。

当时公司有6000名技术人员，我们认为只要大家有热情，迎接这个趋势，专注做好应用就够了。但实际上，大模型处于一个蹒跚学步、非常陡峭的发展期，整个团队在产品、技术上的认知都跟不上。所以2023年我们没有取得什么成果。

2024年我们痛定思痛，在人才方面加大投入。我们请来了很多人才，包括来自阿里、百度、金融行业的专业人士。我们的CTO团队从原来的一人变成了“一正四副”的结构，全部都是AI方面的资深人员。同时，我们还战略性收购了建行旗下的一家公司，这家公司就是为AI而生，用了五年时间积累了非常扎实的AI能力和产品能力。

这些都是我们在认知不足的情况下，为了补课而采取的行动。这个技术本身陡峭得超出想象，只有真正建立起系统的认知，才能走得更远。

格创东智副总裁李楠

李楠：我们是做制造业的，可能和金融行业相比，数据的完整性更差。我们现在遇到最大的坑，就是数据问题。我们更多是做小模型，通过对数据的时序分析建立模型，可以比较快速地搭建出小模型系统。但到了大模型时代，就发现情况完全不一样。

哪怕是中国最顶尖的制造业企业，已经建立了数据中台，问题依然很多。比如A、B、C三个工厂生产的产品是一样的，但因为负责人不同，质量主管不同，对每个数据指标的定义、计算逻辑都不一致。面对我们开发的智能体系统时，由于质量体系和数据标准不统一，在实际落地中就会遇到非常大的挑战。

去年我们做了一个比较大的智能体项目，派了很多硕士、博士去做算法，结果他们到了现场，做的大部分工作其实是数据治理。这块可以说是我们目前遇到的最大困难和挑战。

Zand Bank AI与创新负责人吴海山

吴海山：我们在银行领域，主要负责构建针对银行垂直业务的Agent系统。我们用了很多不同的模型，也踩了不少坑。前段时间我看到一位科学家写的一篇文章，讲他们在开发过程中遇到的坑，我觉得和我们遇到的几乎一模一样。我总结了几个关键点和大家分享。

第一，我们的一个经验，也可以说是教训，与刚才甲子光年报告中的观点有所不同。我们认为模型本身是最重要的，因为模型决定了Agent能力的上限。开发初期一定要先用最好的模型来测试Agent的表现，这样才能判断问题到底出在上下文工程，还是模型能力本身不到位。尤其是在一些复杂任务场景下，比如编程领域，这种差异特别明显。

第二点，在开发Agent的过程中，一定要预判半年到一年之后模型能力的提升幅度。我们在做文档分析时，用了很多传统方案，虽然训练出来的模型结果有一定“幻觉”，但我们预判半年或一年之后，这种任务一定会成为主流。因此我们果断调整了整个技术路径，修改了所有文档处理的方式。不管是用国内的千问，还是其他大模型，这一步帮助我们大幅度降低了后续成本。

这两个坑，是我们感受最深的：一是模型非常关键；二是要对基座模型的发展节奏有清晰的判断力，提前布局。

众安保险首席数据官段朝阳

段朝阳：从应用的角度看，也许是过度乐观，或者说是压力促使，我们一度以为可以快速推动AI的落地。但这种压力反而带来了抵触情绪，很多问题被激化了，没能得到很好的解决。所以我们希望能建立一个更良性的反馈机制。比如说我们从最开始AI系统的错误率大概是7%，通过不断优化，现在已经降到千分之七，甚至万分之七。今天我们的前线营销员工真的非常喜欢用AI，最直接的体现就是他们的收入有了大幅提升。

我们是互联网保险公司，数据基础设施做得相对比较好，AI一上线就能快速在多个场景中进行大规模应用。但我们也发现，原来为数据科学家设计的数据架构，在AI时代还远远不够。

以前的数据系统会有多重交叉验证，能确保最终结果的可靠性，但大模型环境下，整个数据架构必须做非常大的调整。为此我们特别打造了一个叫“航海图”的数据产品，它不仅面向数据科学家，也面向AI和模型开发者，提供更高效的数据调用能力，在保证时效性的同时也提升了准确性。

未来式智能创始人兼CEO杨劲松

杨劲松：我们一开始遇到的，是一个比较典型的大坑。很多企业会希望整个流程都可以实现自动化，甚至完全由智能体承接整个链条。但其实这是一个比较大的误区。

至少目前来看，大模型和Agent技术仍处在发展的相对早期阶段。如果我们一开始就为了追求最后1%的自动化极致效果，那在现实中，不管是从成本还是可实践性来看，差距都非常大。

我们在后续实践中发现，一个更可行的方式，是把Agent和人结合起来，构建一个新时代的知识工作流水线。它的核心思路是，把原有的工作流程拆解开，把那些机器更擅长的任务交给Agent来做，而人则作为协作方进行补充。

就像是在搭建一个“人+Agent”协同的新流水线。通过这种方式，工作效率可以提升2到5倍，虽然达不到我们说的“百倍提升”，但它是一个更接近实际落地的方案。

现在我们在多个行业做的事情，就是搭建这样一套融合系统：人和Agent协作的工作台。Agent会先完成一些基于既有SOP流程、数据量大的任务，给出一个初步结果；人再作为检查者判断Agent的输出是否精准，是否可以推进到下一步；最终由人来决定是否提交。这种模式可以更快地投入到实际生产中，效果也更好。

随着使用过程中的数据不断积累，我们也会将用户产生的数据反馈到模型中，通过微调的方式，让Agent不断升级，叠加能力，进入一个更成熟的状态。我认为这是一条在产业中更可行、更现实的落地路径。

2.实战解密：智能体应用中的真问题

王博：我们行业里看到很多人在拍视频演示各种智能体，看上去都很炫。想问下周明老师，你们是如何向客户证明自己的智能体不是PPT、不是Demo，而是真正可以实战、能够落地的产品？

周明：确实，现在智能体是个热点。它背后核心就是大模型的能力，大家都觉得从“理解”到“推理”再到“行动”是大模型的演进路径，而智能体就是这个路径上的阶段性成果。所谓智能体，其实说的是“代理能力”，再往后还有“创新能力”和“组织能力”。现在AGI大概就走到“智能体”这个阶段了。但我想强调的是：目前的智能体，能力还很初步。

我自己把智能体能力分为五级：

1.简单对话

2.推理能力

3.专家级别

4.自主学习

5.能和物理世界互动的具身智能

现在我们基本处在“第三级”，也就是专家级水平，还远没到自主学习的阶段。大家都期待未来会出现能自己学习、自主成长的智能体，但现实是，现在还做不到。目前，大多数智能体就是一个大语言模型的具体应用，稍微进阶一点，是能够完成一些任务、自动执行操作。但要真正落地，还得回归业务实际。这就回到你的问题：

你必须要非常了解业务场景、非常懂数据，脏活、累活都得自己干。不是拿几个Agent、堆几个组件和流程，就能上线交付给客户。那种做法也许可以拿来做POC、做获客，但一旦涉及实际交付，很容易露馅。要让智能体真正落地，就必须把业务场景和Agent组件有机组合起来。甲方乙方必须密切协作，通过多轮迭代，才能真正“用得起来”。

我们愿意做这个过程中最先尝试的人，虽然很辛苦、成本很高，但希望通过打造几个标杆项目，为后面的智能体应用和行业场景打下基础，加快整个行业的创新速度。

总结一下就是以下三点：

1.要有清晰的技术和业务认知；

2.要愿意做脏活累活苦活；

3.不断提升智能体能力，未来才有可能释放更大的价值。

王博：杨总刚刚提到人和Agent之间的判断和决策问题，什么时候应该是人来做决策？什么时候应该交给Agent来判断？

杨劲松：实际上，在一些企业场景中，会涉及到大量所谓“企业上下文”的内容，这时候人的参与会更合适。我们在构建智能体的时候，会尽量把企业的上下文知识注入进去，但这些信息并不是通过文字就能完整表达的。有些情况非常依赖经验判断或者组织内部的默会知识，这时候由人来做判断，会更有帮助。

王博：刚刚听李总谈到，数据问题不仅仅是多模态的问题，更重要的是原始数据是否清晰，以及后续治理的能力。那你们现在有没有更好的方式，帮助数据变得更标准化、更可用？

李楠：这是一个基本功的问题。我们现在更多采取的做法是，让大数据团队先进入企业，从顶层设计开始，帮他们构建指标体系。从指标体系往下搭建一整套数据基础和数据标准，然后再把数据按照正确方式清洗，最后提交给业务或模型开发团队。通过这种方式，后面的问题就会少很多。

王博：我相信今天在场也有很多观众关注“出海”的问题。吴总，你在阿联酋这边有很多出海经验，能不能聊聊在海外遇到过哪些“坑”？

吴海山：阿联酋有一个很大的优势，就是它对芯片使用没有限制，各种模型都可以跑。另外一个特别明显的优势是，用户的付费习惯非常好。我之前也在国内银行工作，对国内企业的痛点比较了解。国内很多AI公司产品做得真的非常好，但在C端几乎很难收费，我看到有一家创业公司做得非常优秀，但收费转化率不到1%，这让人非常遗憾。

再一个，企业客户的付费意愿也不强。很多企业更愿意为看得见摸得着的硬件付费，但对软件的价值认知还不够。所以在阿联酋包括整个中东地区，企业和个人的付费意愿非常强，这对中国企业是个很好的机会。我建议，中国很多面向C端的好产品、好技术，可以加快出海节奏，特别是往中东、阿联酋这样的国家走。我们也很愿意做一个桥梁，把这些优秀的技术和产品带到国际市场。

3.前瞻洞察：行业智能体赋能新格局

王博：今天圆桌最后一个问题，想请各位预测一下：到明年，你认为哪个行业的智能体最有可能实现大规模落地应用，并真正创造价值？

周明：首先，金融行业的落地是没有问题的。其次，我看好AI for Science这个方向。AI可以帮助科研人员做调研、发明、定理证明，甚至撰写论文。整个过程的效率将会被大幅提升。

段朝阳：从行业角度来看，我一直从事金融行业。金融本质上是一个经营风险的行业，而风险是由数据刻画的，AI正是通过应用数据来刻画风险的刻刀。因此我相信，AI在金融行业的应用将会表现得非常突出。

我认为另一个比较明显的方向是智能驾驶，也就是智能出行。这个判断可能比较大胆，但我认为值得关注。

吴海山：我认为到2027年，最有可能被取代的就是初级程序员。我刚刚看到一则新闻，说编程能力又有了大幅度的提升。我们在开发过程中发现，真正的编程环节中，80%的tokens其实都是消耗在编码上。如果AI继续以这样的速度发展，初级程序员大概率就不需要了。但像架构师这样的角色仍然非常重要。

目前我们使用AI进行编程，通常是先做架构，再写程序，能实现至少80%以上的代码自动生成。不像外界担心的那样会泄露数据，只要做好架构设计和代码分析，是完全可以达到生产级效果的。所以我认为到明年，初级程序员可能就不存在了。

李楠：从制造业来看，最有可能率先落地智能体应用的，是半导体和汽车制造这两个大行业，因为它们的自动化和信息化水平相对比较完备。而其他行业，当前最重要的任务是先补齐数据的短板，数据问题解决之后，其他应用才能有效推进。

杨劲松：我认为可以从三个维度来判断哪些行业更容易落地智能体：一是高度标准化，二是高频发生，三是低复杂度。按这个逻辑推演，未来几年或已经开始落地的行业，首先是客服，市场营销，现在发展到初级Coding这样的方向。

耿俊岭：当前存在大量重复性强、规则清晰的岗位，这类作业人员在整体岗位中占比很高，也最容易被取代。就像这次峰会中提到的，制造行业很可能会率先实现大规模的“机器化人”。

查看原报道请点击“阅读原文”

（封面图及文中图片来源：2025世界人工智能大会“智能体驱动产业变革论坛”）

关于澜舟科技

ABOUT

北京澜舟科技有限公司（简称澜舟科技）成立于 2021 年，是一家业界领先的认知智能公司，致力于以自然语言处理（NLP）技术为基础，为全球企业提供新一代认知智能平台，助力企业数字化转型升级。

澜舟科技专注垂直领域、专业赛道，深耕智能体，聚焦金融领域，引领大模型行业应用，其主要产品是基于大模型技术为企业提供智能体(Agent)及数字员工应用产品及服务。

商务洽谈👇

往期文章推荐

”

澜舟科技官方网站

https://langboat.com

获奖与新闻

新品发布｜澜舟智能助手：高效管理知识，精准搜索问答

澜舟智会再升级｜企业用户与专业人士的智能会议助手

澜舟科技获批北京市专精特新中

HICOOL 2021创业大赛一等奖 | 周明博士专访

技术专栏一览

tDRO:面向大模型稠密检索的任务级分布鲁棒优化

澜舟科技新突破：大模型实现“持续学习”

澜舟智库｜AI文档辅助写作

孟子3-8B开源｜孟子3-13B开源

澜舟科技公众号

期待您的关注：）

内容中包含的图片若涉及版权问题，请及时与我们联系删除

WAIC2025实战派圆桌实录｜周明：智能体要真正落地，还需回归实际业务

1.经验之谈：AI落地中“坑”与“认知”

2.实战解密：智能体应用中的真问题

3.前瞻洞察：行业智能体赋能新格局

HICOOL 2021创业大赛一等奖 | 周明博士专访

评论列表

评论