阿里巴巴联合上海人工智能实验室发布《守己利他:智能时代做负责任的技术》白皮书已于近日发布。点击查看发布详情👉阿里巴巴联合上海人工智能实验室发布AI安全白皮书


接下来为全文连载,以下为第一章《引言》、第二章《人工智能发展和安全的总体趋势👇



2025年,人工智能技术持续快速跃进,不仅深度重构数字世界,更以前所未有的广度介入物理世界。不断提升的模型能力打开了人们对智能应用更大的想象空间,发展的重心也向产业上下游延伸。以“AI+云”为引擎加速推动计算资源、基础模型与应用生态的全栈发展,并驱动人工智能服务走向全球化,带动“技术-产品-市场”的正向循环。

随着人工智能在千行百业的渗透普及,各方不仅期待人工智能的能力变得更强,而且更加关注其对人类社会带来的各类影响,期望推理、多模态等前沿技术以及智能体等应用更加负责任。国际社会日益形成共识:安全与发展并非对立,而是“一体两翼”。我们既要保障技术创新、形成智能红利,又要合理管控风险、保障人类安全,守护安全底线、尊重人的尊严与权利,并接受多方主体的持续监督,让人工智能做到合伦理、有克制、不伤害。“守己”是负责任人工智能技术的必要前提条件。

在此进程中,开源开放正成为构建可信AI的关键路径。2025年,中国已成为全球开源大模型生态的重要贡献者。开源不仅降低了技术门槛,更通过代码透明、社区协作与敏捷反馈,推动安全知识的公共化与治理能力的集体进化,提高了社会对人工智能的信任,一个由开发者、企业、社会组织、公众与主管部门共同参与的信息透明、敏捷反馈、多方协同的治理生态正在形成,使人工智能在高速发展中仍能获得及时、有效、包容的约束与引导。“利他”代表了对负责任人工智能技术的更高要求。

知行合一,理念终归要落地于实践。“守己”与“利他”的价值主张,正内化为领军科技企业战略布局的核心原则。

作为“AI+云”战略的实践者,阿里巴巴坚持守己、利他的负责任创新,贡献更好、更安全的全栈人工智能技术,提供更多样、更有温度的智能应用服务,促进行业可持续发展;并通过模型开源、标准共建与跨国对话,与全球伙伴共同定义负责任人工智能的技术规范与实践路径,让人工智能在向好、向善的轨道上行稳致远,服务全球。

上海人工智能实验室聚焦人工智能发展与安全战略性、前瞻性需求,联合国内外学研力量,持续深化人工智能领域关键核心技术攻关,探索通用人工智能路线,引领推动我国人工智能科技创新与产业创新深度融合;同时,通过战略性项目布局持续催生重大科学突破,让人工智能深度赋能国家建设,助力全球发展。


01

人工智能发展与安全的总体判断

| 1.1 AI全球化发展是世界的主旋律,开源开放成为中国AI创新的重要路径

大模型技术问世以来,如何控制AI风险、保障AI安全成为各国关注的重点。美、英等国家相继设立国家级AI安全研究机构,例如美国AI安全研究所(现称“美国AI标准与创新中心”)、英国AI安全研究所,聚焦前沿风险研判;欧盟通过《AI法案》构建基于风险分级的监管框架;我国则创新性建立“备案+检测+评估+标识”四位一体的大模型全生命周期治理先进实践,在鼓励创新的同时保障安全。我国的相关法规、标准、实践指南体系完备,覆盖大模型事前事中事后阶段,并得到充分落实,使得公众对大模型技术的信任度高,反映出治理有效性与社会接受度的良性互动。

2025年以来,大模型技术在推理、多模态等方向持续突破,成为了世界知识的入口和各行各业通用的工具。法国率先在巴黎AI行动峰会提出了推动AI发展的诉求,美国特朗普政府则废止了AI安全行政令,提出以持续高速创新和技术应用扩散为目标的AI战略构想,中东、日韩、东南亚等国家也积极拥抱AI。国家层面对AI的关注从模型、算法、算力延伸至电力、网络等基础设施以及人才、资金等资源支持,以提高模型能力为重心、支持AI全栈技术的协同发展成为共识。

2025年6月25日,国务院总理李强在第十六届夏季达沃斯论坛开幕式上指出:“中国创新具有明显的开放、开源特征,我们愿意向世界分享原创技术和创新场景,也支持国际联合研发、应用推广,通过开放合作促进各国创新发展。”我国持续推出高质量开源模型,使用门槛不断下降,将AI的能力源源不断地转化为生产力。我国开源衍生模型数量全球最多,集聚全球开发者力量、多元化技术路径发展、多样化应用生态开源成为了AI发展的核心路线。

1.2 大模型发展转向应用侧,需配套模型、数据、网络等全方位的安全能力

大模型技术的发展推动从算力到智力的转化,推理能力的提高让大模型能够分析理解指令要求、执行复杂任务,多模态的发展让大模型具备了更强的现实认知能力,大模型正在接管数字世界,改变物理世界。2025年以来大模型的产业应用渗透加速,伴随Agent的普及,大模型进一步激活用户数据、重构传统软件,人类正步入智能经济的时代。

大模型发展的重心也走向应用侧,需要持续推出能力更强、效率更优的模型,更需要围绕用户和场景构建应用生态。大模型安全治理进一步向用户侧延伸,围绕模型应用落地过程中的实际问题,重点保护用户数据权属和隐私、保障用户对模型的控制、促进Agent的有序协同。AI应用安全需要模型、数据、网络等全方位的安全能力,公共云既能提供最先进、最安全的模型,也能够为用户使用模型提供全面保障,是模型应用的最佳解决方案。

1.3 安全需要多方合作,共绘AI安全与性能平衡发展的美好愿景

统筹AI发展与安全,是AI治理的核心要务,也是我国的成功经验。风险伴生于发展,AI的发展具有高度的动态性。AI的风险也具有阶段性,AI技术的完善在不断降低其本身的风险,对此企业一方面需要在发展的过程中积累科学依据和实践经验,理性地判断AI前沿科技创新带来的风险,避免过早、过急、过重的外力治理,另一方面通过凝聚政产学研各方的力量,在AI技术发展和应用拓展的过程中同步建立风险判别和处置机制,提前发现、识别风险,通过技术手段加以修复、应对,采取多方合作的方式将负面影响降至最低。

在2025年世界人工智能大会(WAIC)科学前沿全体会议上,图灵奖得主杰弗里·辛顿(Geoffrey Hinton)在与上海人工智能实验室主任、首席科学家周伯文教授的对话中指出,“让AI更聪明”和“让AI更善良”会有不同的技术,而国家之间可以分享“让AI更善良”的技术。“让AI更善良”一直是中国人工智能企业和科研机构对负责任AI技术的追求与希冀。在2024WAIC上,上海人工智能实验室周伯文主任率先提出“AI-45°平衡律” (AI-45° Law)的技术思想,强调人工智能性能与安全应协同演进。这一判断从长期主义视角提出AI安全与性能的应然关系,描绘了人工智能安全与性能协同演化的总体愿景。

人工智能安全既需要持续的安全投入,也需要凝聚各方共识与技术合力,共同推进安全技术成果的积累与落地。在中国人工智能治理实践中,政府、企业、科研机构正在走向敏捷协同,共同推进安全能力共建与风险知识共享。上海等地政府监管部门主动推动治理模式创新, 通过平台建设、服务匹配等方式支持和帮助AI企业提升安全素养、构建安全能力,培养全社会负责任地使用AI的意识,推动AI安全可信发展。

全球合智方能全球善“智”。《人工智能全球治理上海宣言》倡导建立全球范围内的人工智能治理机制,鼓励国际组织、企业、研究机构、社会组织和个人等多元主体积极发挥与自身角色相匹配的作用,参与人工智能治理体系构建与实施。面向未来,中国人工智能企业与科研机构有信心为全球人工智能治理提供前沿技术能力,让人工智能真正成为造福人类的国际公共产品。


02

对人工智能安全的基本态度守己

2.1 守己

模型安全是保障AI有序发展的基础。模型能力的不断提升对模型安全提出了新的要求,基于模型结果输出的概率性和不确定性,模型安全从单一结果导向走向能力完整度和成熟度导向。模型技术的不确定性决定了对模型安全的评价难以使用静态的标准,对安全的建设不能一蹴而就,需要坚持长期主义,基于AI范式发展探索安全技术前沿,在模型发展中持续提高安全水平。大规模、全尺寸、多模态开源带来巨大的安全挑战,阿里巴巴加强内生安全与外围护栏等技术投入,持续提升模型的安全性能:在模型上线前开展安全红队测试,确保其在核心应用场景中具备强鲁棒性;同时,部署数字水印等策略工具,增强生成内容的可追溯性,有效防范下游误用与滥用行为。

应用安全体系是AI发挥生产力的必备要素。作为通用技术,大模型应用已经渗透千行百业,融入生产、供给、消费等数字经济的各个环节,企业用户、社会公众对大模型应用安全提出了差异化的要求,对此需要建立满足应用需求的多层次安全能力体系,构建安全可信的云上大模型服务,满足各类终端用户、多重处理环境、智能体构建、国内国际应用等的多样化应用安全要求,让模型应用走好最后一公里、让模型服务受到各类用户的信任。

2.1 利他

负责任的模型开源,建设资源开放的生态,实现普惠、促进安全、繁荣生态,是AI发展的重要路径。开源文化孕育了技术创新和进步的基本范式,而开源AI则从代码自由走向资源开放。模型开源使得技术更为普惠,让更多的人能够低成本用上最优秀的模型,通过使用积累经验、降低试错成本,产生众人拾柴火焰高的效果,是技术向善的自觉选择,同时开源生态帮助连接技术与市场,满足产业多样化的应用需求,促进技术赋能千行百业。

在安全侧,开源模型的技术风险和闭源模型相比并没有新的增量,我国对模型事前备案以及事中事后的检查、标识,以及产业界采用的评测等方案,可以有效管控开源模型的风险。在开源生态中,通过去中心化的协作机制构建起全球开发者共享的技术公地,各方基于社区共识和自我约束,自觉自律遵循社区规范,平台借助技术工具和倡议提升风险意识和治理效率,在遵循法律底线的基础上共同维护良好有序的生态秩序。

大模型是全球造、全球用的全球化工具,服务全球、普惠全球是模型发展的本能诉求。大模型的强大能力根植于世界知识的积累与协作创造。通过多语言、多文化的训练数据集构建,大模型能够吸收人类文明的多样性智慧,将其潜藏的客观规律和人类价值观转化为跨文化、跨领域的通识能力;其依赖的数学原理和核心框架为全球共享的科学共识,全球学术界和工业界的协同创新推动了算法的不断演进。

此外,模型的广泛扩散能够带来巨大的规模效应与生态优势,推动技术走向全球共创共享:通过开放协作激活全球开发者网络,显著提升技术研发的迭代速度与创新能力;依托云基础设施建设服务全球的模型服务平台,突破模型能力的地域限制,实现全球范围内的高效部署与优化;通过技术手段适配不同地域多样化的文化与价值,在坚守国家立场的基础上兼顾不同文化背景与价值诉求,构建包容型技术生态、实现文化共存。

以负责任的态度,主动评估并积极应对大模型对经济社会带来的影响,促进AI正向价值的有效发挥。在生产要素层面,AI对算力的需求带来的能源环境挑战,对优化全国能源配置,推动能源结构绿色转型,实现产业发展与环境保障的平衡提出需求;在生产力层面,AI作为生产力工具为千行百业的效率提升与业务创新注入强大动力,同时AI也深刻改变劳动力个体的工作方式和就业市场,带来了新的机遇和劳动力结构的转型;在生产关系层面,AI驱动组织结构向去中心化、扁平化演进,并拓展组织边界、发展更具弹性的生态系统,同时AI也在重构商业模式,带来新的商业合作机遇,驱动数据价值释放并催生科技与内容产业间创新共赢生态。此外,AI技术在语义理解、多模态等多方面能力的提升,能够帮助引导正能量内容的生产、识别和分发,实现AI对于社会发展的正向引导和促进作用。

2.1 合作

政产学研共建AI安全与发展生态,积累和贡献该领域的公共知识。AI技术发展至今,其创新过程仍具有高度的动态性和不可解释性,而人工智能应用的快速渗透和广泛铺开,一方面使得AI安全风险呈现出高度不确定性,另一方面也让社会各生产环节跃跃欲试,针对AI的安全治理与应用潜力呈现出多利益主体的“共同无知”。

面对人工智能技术发展和社会影响这一复杂系统,需要坚持长期主义,构建政产学研知识共享和协同共治机制,共同探索、学习和积累AI安全与应用发展的公共知识,提升安全与发展共识水平:通过建立开放共享的知识库平台,系统化沉淀风险案例、攻防策略与治理经验,将分散的认知转化为结构化公共资源,同时联合优质客户探索人工智能应用发展案例,积累应用实践经验与可验证的数据化资产,形成底层产品能力反哺行业中小客户;依托联合实验室与跨学科研究网络,针对前沿安全威胁开展预研攻关,推动测试工具、评估框架的标准化输出,同时面向人工智能技术发展前沿,探索更多可落地的多模态技术能力;设立常态化对话通道,促进政策制定者、技术开发者与伦理学者在动态演进中持续校准风险认知。



🌟 下期预告

第三章:《守己:坚持长期主义保障模型及应用安全。公共云提供了AI应用安全的可靠保障方案》、第四章《利他:用开源建生态、用开放促普惠,负责任地评估应对AI发展中的影响


这是阿里巴巴连续第四年发布人工智能治理方向的实践成果,致力于弥合公众与AI之间的认知鸿沟,用系统性的实践和思考助力行业的发展。

👇点击下方【阅读全文】查收电子版全文



📺直播预告


《山海夜话》第三期深度解读:数字虚拟人的法律与治理边界👇


📌往期推荐


AAIG课代表,获取最新动态就找她👇
图片

关注公众号发现更多干货❤️

图片
图片
图片

内容中包含的图片若涉及版权问题,请及时与我们联系删除