图片

阿里巴巴联合上海人工智能实验室发布《守己利他:智能时代做负责任的技术》白皮书已于近日发布。点击查看发布详情👉阿里巴巴联合上海人工智能实验室发布AI安全白皮书

图片

接下来为全文连载:
第一章《引言》、第二章《人工智能发展和安全的总体趋势
第三章《守己:坚持长期主义保障模型及应用安全。公共云提供了AI应用安全的可靠保障方案》

以下为第四章《利他:用开源建生态、用开放促普惠,负责任地评估应对AI发展中的影响》👇

开源不仅是技术工具,更是实现技术普惠、知识民主化与责任共担的发展路径。开源生态通过LAMP、GitHub、TensorFlow、Hugging Face等基础设施,奠定了互联网与大模型发展的基石;大模型开源则显著降低技术门槛,使中小企业和研究者能平等参与创新,体现了“技术向善”的主动担当。

| 1.1 开源开放生态的利他属性

🎈1.1.1开源文化孕育了技术创新,推动了技术进步

开源项目为互联网技术奠定了基础LAMP技术栈(Linux, Apache, MySQL, PHP)共同构建了早期互联网生态系统的核心框架。GitHub通过其强大的版本管理和代码托管功能,形成了全球开发者协作网络,使代码共享、问题追踪与社区贡献成为常态。开源推动了技术标准的统一,为跨平台协同创新提供了基础,也直接推动了互联网应用生态的繁荣。例如,Web应用能够在不同设备和操作系统间无缝运行,成为数字时代不可或缺的基础设施。

开源项目为人工智能的发展提供了必要条件开源技术提供了核心工具链,支持了人工智能的快速发展。TensorFlow和PyTorch等开源深度学习框架成为研究与工业应用的基础,显著缩短了从算法原型到产品化的周期。多样化数据集与评估基准、开发工具链与部署方案帮助开发者快速验证产品概念。开源社区(如ModelScope、Hugging Face)分发开源数据集(如ImageNet、COCO)及评估指标(如BLEU、ROUGE),提升了模型性能验证的可信度。开源工具(如Docker、Kubernetes)与云原生技术结合,支持了模型从训练到部署的全流程自动化。

开源增强了大模型技术的安全性和可信度开源生态为构建开放、透明且协同治理的架构提供了坚实基础,多方参与确保了模型安全性的充分验证,并及时发现可能的错误和偏差。开源机制增强了公众和监管机构对大模型系统的信任,潜在风险更容易被发现并公开讨论,形成了良性反馈机制和责任共担文化。开源社区通过标准化测试框架(如MLPerf)和公开基准增强了模型性能的可复现性,减少了“黑箱”争议,提高了研究成果的透明度和公信力。



🎈1.1.2 大模型开源的核心本质是技术普惠


大模型开源是技术向善的自觉选择。大模型开源这一行动,不仅体现了对开放协作理念的深刻认同,更彰显了行业主体在技术演进路径上的责任意识与价值担当。技术向善不是被动遵循的规则,而是主动承担的责任。开源社区的共建共治、数据资源的开放共享、算法能力的透明可解释,都是这一理念的具体实践。它不仅加速了技术进步本身,更在深层次上传递出“科技服务人类”的核心价值,为构建包容、公平、可持续的智能时代奠定坚实基础。


以普惠为内核促进技术公平与知识共享大模型开源在经济利益角度是技术普惠。大模型研发存在高昂的技术与资金门槛,大尺寸的模型单次训练成本在数千万到数亿人民币。大模型厂商承担了训练成本,持续开源高水平大模型推动行业进步,支持文本、图像、音频、视频等多种输入输出模态;从百亿到万亿参数的全尺寸到生成、推理、多语言支持的全功能开源大模型,涵盖自然语言理解、计算机视觉、语音识别等能力,并投入大量资源来进行持续的维护和升级。大模型开源使得中小创新主体参与进来,更广泛的群体得以使用先进技术并受益


通过分布式协同共创模式形成知识民主化和责任共担开源依托的去中心化、多元协作驱动的组织形态,不仅显著提升了技术研发与迭代效率,更是有效打破了传统信息垄断格局,为技术教育普及和技术能力下沉提供了坚实支撑,使技术进步更具包容性与可持续性。在这一过程中,“技术开源→生态繁荣→商业反哺”的良性循环机制逐步形成。开发者不仅是技术的使用者,更是治理规则的共建者。他们通过参与文档撰写、代码审查、标准制定、伦理讨论等环节,共同构建起一个由多方利益相关者协同参与的治理体系,实现了技术创新与社会责任的同步演进。因此,开源不仅是技术发展的高效路径,更是推动知识民主化、促进社会公平的重要机制创新,体现了全球科技共同体在面对复杂技术变革时的责任意识与集体智慧。


🎈1.1.3开源生态连接技术与市场,促进行业发展


开源生态加速技术演进,降低试错成本和资源浪费


开源模式通过开放核心算法、数据集及训练框架,极大地促进了前沿研究成果和技术创新的迅速传播。社区内丰富的讨论与实践反馈为技术路线的选择提供了宝贵指导,帮助业界识别最具潜力的研究方向和应用领域,降低技术试错成本。以Qwen的开源为例,众多模型开发者借鉴其设计和训练技巧,显著提升了整个行业的技术水平。此外,开源项目通常配备详细的文档、教程和示例代码,为开发者提供了直接的学习资源和实践指南,减少了重复探索,最终让业界的算力资源、人才资源等都得到了更高效的配置。


开源生态提供可及性和开放性,提升大模型应用开发的灵活性和多样性

大模型的开源让开发者可直接访问模型代码、参数及技术报告,而非仅依赖API接口,从而实现对模型架构的透明化理解。开源协议(如MIT、Apache 2.0)允许模型修改、分发与再训练,为二次开发和垂直领域适配提供开放性(Openness)。开源生态系统提供了丰富多样的技术资源,包括模型文件和推理代码、工具链、评测数据集等,使得开发者能够快速验证产品概念并实现从想法到产品的转变。开源环境下的高度可及性和开放性允许开发者根据自身需求对模型进行定制化改造,如调整模型结构、替换损失函数或优化训练策略,以满足特定任务的需求,高效完成技术验证,形成多种应用模式“百家争鸣”的态势,为AI应用生态的蓬勃发展提供了必要支撑。

开源生态连接高科技成果与各行各业,推动行业多样化发展

借助开源大模型的基础,各行业负责人可以根据不同应用场景的需求进行技术决策、快速适配,设计出针对性强、适应特定行业场景的解决方案。这种广泛的应用性不仅刺激了创新活动,还催生了基于大模型技术的新业态和新服务模式。同时,开源生态促进了产业链上下游企业的协同发展。面对不同的应用场景需求,部分企业要求模型参数规模较小以适应设备的限制;而另一些则追求极致性能,需要最大尺寸和最强能力的模型支持;更多情况下,企业希望在效果与成本之间找到平衡点。开源生态正成为驱动各行业数字化转型的重要力量。

开源普惠与商业化利益的平衡


开源在给予技术普惠的同时,以更开放的方式构建长期、健康的商业模式。开源大模型通过“开放基础能力 + 增值服务”的分层策略,有效实现商业化闭环:基础模型免费开放,降低开发者和中小企业的使用门槛,激发生态创新;同时,通过API调用、定制化训练、专属支持等高阶服务获取合理回报,推动技术生态扩展。这种模式不仅扩大了技术的广度,也沉淀了高价值客户需求,反哺研发迭代。


因此,开源普惠与商业可持续并非对立——前者加速生态繁荣与技术扩散,后者保障持续投入与产品演进。二者相辅相成构建“越开放、越活跃;越活跃、越可持续”的正向循环,真正实现技术价值与商业价值的统一。


| 1.2 基于开源生态的AI应用服务


基于开源生态的AI应用服务体系包括两个部分,提供底层技术工具的开源生态与面向终端用户的上层应用服务。这种界分不仅体现了生态链上的分工,更反映了责任与风险承担的明显区隔:底层开源生态通过技术开放赋能应用创新,其定位和风险属性与上层应用服务存在本质差异,二者由开发者/技术支持者这一关键角色连接,形成“开源技术供给-应用服务转化”的生态链。



🎈1.2.1 底层开源生态的角色分工


大模型开源是指模型贡献者将训练完成的模型权重、推理代码、技术报告等依据开放许可协议(如Apache 2.0、MIT)向公众开放,允许全球开发者自由访问、修改和分发。其依托GitHub、Hugging Face、ModelScope等第三方开源社区提供给开发者,使下游开发者可基于开源模型进行研究、二次开发和部署,极大加速技术迭代并降低重复研发成本。开源生态的角色包括:


开源方(模型贡献者):贡献底层技术工具,是开源生态的源头活水。开源方研发和开放模型技术,但不介入终端应用,模型开源后,其对下游开发者/模型使用者不具有控制力。


开源社区(技术枢纽):为开源模型搭建基础设施、帮助模型托管与分发,是开源贡献者与开发者的桥梁。不直接参与模型的开发,也不参与实际应用。


开发者(模型使用者):既是模型的测试验证者,也是技术落地的价值转化器。他们通过测试评估性能、稳定性与安全合规,反馈问题并贡献代码与文档,推动“使用—测试—反馈—优化”闭环。开发者通过技术分享降低参与门槛,借助社区互动传播开源理念开发者处于开源生态的末端,同时也是应用生态的起点。


🎈1.2.2 上层应用服务的角色分工

开源生态赋能开发者,能够快速开发上层应用服务上层应用服务的角色包括:


技术支持者:开源生态中的开发者通常是技术支持者,开发部署模型、为应用提供技术支持。


服务提供者:基于技术支持者提供的技术支持部署应用,供用户低门槛使用。


用户:使用AI应用服务实现完成特定工作任务、生活休闲娱乐等目的,其需求是AI技术和应用设计的出发点和落脚点。


🎈1.2.3 工具与应用的辩证分离


开源模型是开放的底层算法工具,本身不构成完整AI应用,也无法直接生成面向公众的服务内容,固有风险有限。真正对人类生产和生活造成的风险主要源于二次开发的具体应用。例如,用户通过基于开源模型的AIGC应用创作内容时,才可能引发实际风险。


这一“技术工具”与“应用服务”的分离正成为部分国家监管实践的趋势。例如,加拿大《人工智能与数据法案》(AIDA)明确:未被整合进完整AI系统的开源模型不在规制范围内;但若用于构建高影响力系统,使用者须履行合规义务。


因此,治理应分级分层:开源方负责安全发布与透明披露,社区推动生态自治,开发者和服务提供者则对应用场景风险担责。通过“生态自律+法律底线”协同,实现精准责任分配,构建鼓励创新且安全可控的负责任开源生态。


| 1.3 负责任的开源生态风险治理



🎈1.3.1 风险治理原则

原则一 :以生态自律为主、坚守法律底线

开源生态治理首先依赖于社区共识与自我约束机制自律是开源的进化优势,以更低的合规成本释放更大的创新效能,形成生态信任的底层逻辑。通过建立社区规范、倡导负责任的创新、推动透明披露与共建共享文化,生态成员可主动识别风险,并互相监督,自觉采取措施防范潜在风险,确保风险治理措施的落地。


这种治理模式的核心在于:一是通过共识性规则降低外部依赖,例如通过开发者自治公约明确技术伦理边界;二是利用技术透明化手段增强生态成员的互信基础;三是构建动态调整的反馈机制,使风险防控措施能随技术演进持续优化;四是持续跟踪、响应与引领全球AI治理发展,在开放创新中主动对齐与建立国际安全标准,动态保持与主流AI治理框架和原则的一致性。


开源生态也受法律底线约束。法律约束的本质为技术创新划定不可触碰的底线,既保护公共利益免受技术滥用侵害,也为生态成员提供明确的行为边界。通过将法律责任与技术实践深度绑定,从源头防范系统性风险。对于基本的数据安全、内容安全、网络安全问题,各方仍应严格遵守适用法律规定,包括但不限于网络安全、数据安全相关规定,确保技术发展不逾矩、风险可控。


原则二 :分级分层治理、区别底层开源与上层应用


开源生态与应用服务端的风险有本质的区别。前者风险在技术研发环节,面向专业领域的开发者,实际风险较低、影响面较窄;后者直面终端场景的广大用户或企业,影响面更广、出现风险的可能性更高。


这种区别源于技术链条的分工特性:开源生态的核心是技术供给而非直接服务交付,其风险主要体现为技术缺陷的潜在可能性,且受限于开发者群体的专业性与自律性;而应用服务端需将技术转化为实际产品,在用户交互、数据流转、商业部署、日常运维等复杂场景中面临多重风险叠加,其风险敞口随着服务规模呈指数级扩大。


在开源生态内部,开源模型贡献者、开源社区、开发者在责任分配时,也需要充分考虑各主体在预见性、控制力上的差异进行精准治理,有效平衡风险防控与生态发展负责任的风险治理针对三者分别包括负责任地发布、负责任地组织、负责任地使用。


精准治理的核心在于匹配主体能力边界:贡献者需对技术源头的可控性负责,社区需对生态规则的公平性负责,开发者需对技术落地的适配性负责。通过差异化责任划分,既能避免过度抑制创新活力,又能确保风险防控措施贴合各环节的实际能力,最终形成“技术创新-应用繁荣-风险共治”的良性循环。


法律法规对基于开源大模型再进行的上层应用服务提供、用户使用等环节设定了明确的界限和责任,比如中国在生成式人工智能领域典型的法规包括《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等具有强制约束力的社会规则。


这些法规通过界定“技术中立”与“责任归属”的边界,要求服务提供者在商业化过程中承担合规义务(如用户身份验证、内容可追溯性),从而将法律约束转化成可操作和更精准的技术规范。


🎈1.3.2 负责任的开源生态各角色责任分配


开源方


作为创造和贡献者,开源方发布开源模型、开源数据集等技术工具资源,是推动技术创新和知识共享的重要力量。同时也应披露相关信息,如许可协议、使用限制、模型预训练阶段和优化训练阶段的信息、模型架构、评估情况等。这种信息披露不仅是技术透明性的体现,更是构建生态信任的基础。例如,明确的许可协议可避免法律纠纷,使用限制声明能引导开发者规避高风险场景,模型评估报告则为技术迭代提供基准参考。通过系统性披露,开源方既履行了对技术开放的承诺,也为下游开发者的负责任使用创造了条件。


模型开源后,贡献者对模型使用者/下游开发者的控制力有限,模型使用者可以对模型进行微调和二次开发,将模型部署和应用于新的环境。这些都脱离了贡献者的掌控范围,也不可预见。这种不可控性源于技术开放的核心价值:开源通过解除技术壁垒激发创新,但也意味着贡献者无法预判模型在何种场景被改造、如何被应用。例如,一个原本用于图像分类的模型可能被二次开发为特定领域的工具,而贡献者难以充分预见所有潜在风险,也无法通过行之有效的技术手段限制其具体用途。


开源社区


作为工具资源的托管社区,开源社区连接贡献者与开发者,为技术研究和生态构建提供支持。其责任主要是通过规则设计与辅助能力建设来引导和促进开源方与开发者的行为规范,包括制定发布标准和信息披露要求、提供工具进行合规检查、建立违规举报响应机制,推动社区自治,提升整体生态的透明度与可信度。社区的核心价值在于搭建信任基础设施、提供规则、赋能治理:通过标准化流程(如模型发布前需要的说明)降低技术滥用风险,通过自动化工具减少法律争议,通过透明化机制增强生态成员的规则意识。这种“规则赋能+技术支撑”的双重角色,使社区既能保障开源生态的开放性,又能为技术创新划定可预期的边界。


开源社区本身不直接参与模型研发与下游开发,受限于角色定位与技术条件,难以对模型训练数据的合法性、模型自身的安全性及其最终用途的正当性作出全面判断因此无法承担超出其能力和职责范围的风险防控义务,否则可能产生过高的合规成本抑制社区的促进作用。在“守己利他”的原则下,社区应聚焦于推动生态共建共治共享,形成既鼓励创新又保障安全的开源共同体。这种角色定位决定了社区需要通过“轻量化治理”实现价值平衡:一方面,通过技术中立的规则设计(如强制性信息披露模板)引导生态成员自我约束;另一方面,通过开放接口与安全治理工具共享(如Qwen-3Guard安全审查模型),将风险防控责任合理分配给可实际操作的主体。在“不越界、不缺位”的治理逻辑下,社区既能维持其作为技术枢纽的核心功能,又能通过协同共治机制提升整体生态的安全韧性。


开发者


开发者在开源社区上选择、下载和使用开源模型,是开源技术的验证者、成果享受者,其基于开源模型开发具体行业或领域的应用,自行或再通过第三方对公众提供服务,推动技术提升和价值转化。开发者的双重角色决定了其在生态中的枢纽地位:一方面,在开源生态中通过技术验证(如压力测试、场景适配)确保模型可靠性,另一方面,在应用服务生态中通过商业化应用将技术成果转化为社会生产力。在“从实验室到市场”的价值链条中,开发者既是技术红利的受益人,也是风险防控的重要一环。


开发者了解或身处具体应用情境中,对不同场景下潜在风险和影响更能精准把握和预见,尤其是在涉及数据处理、用户交互、商业部署等关键环节时,应主动评估相应的法律、安全和伦理风险。在应用端按照风险大小进行分类分级的治理,无论对开源或闭源模型,都适用且一致。这种分类分级治理的本质是将技术风险与社会影响相匹配,开发者作为技术落地的执行者,需通过动态风险评估框架(如考虑数据敏感性、用户规模、场景伦理边界)制定差异化治理策略,确保技术应用既符合合规要求,又符合社会预期。


开发者如面向公众提供应用服务时,依照法律要求承担技术支持者和/或服务提供者的合规义务,典型的义务包括内容标识、算法备案、违法信息过滤、个人信息保护等。


🎈1.3.3 负责任的开源生态建设实践

负责任的开源生态离不开开源方、开源社区与开发者三方主体的协同共建,通过制度设计、技术实践与文化塑造,形成权责清晰、流程规范、反馈及时的良性治理闭环。在当前大模型技术快速演进、开源社区日益活跃的背景下,构建一个安全、可信、可持续发展的开源生态系统,已成为推动人工智能技术健康发展的关键支撑。结合国内外实践案例,负责任开源生态的实践包括:

开源方——负责任的开源

作为技术源头,开源方在模型研发与发布阶段即需建立全生命周期的安全与合规管理机制,确保技术输出的透明化、可控性与可解释性。

提前构建覆盖训练数据准备、训练优化、评估验证及持续迭代的安全体系,以系统性降低模型开源后的技术风险。例如,通过建立涵盖数据清洗、偏见检测、输出过滤与红队测试在内的多层防护机制,降低模型生成违法不良信息的风险。

选择规范运营的开源社区发布,积极提供模型开发、训练阶段和模型架构等信息,提升模型透明性。通过在具备资质认证和运营规范的开源社区(如 Hugging Face、ModelScope、GitHub)上发布模型,提升技术透明度。

设定清晰的开源许可证,明确约定贡献者与使用者的权利和责任明确的授权条款是保障开源生态健康运行的基础。Llama 2 采用的“Llama 2 Community License”虽非OSD( Open Source Definition)定义的标准开源协议而引发争议,但通过要求大体量商业实体单独获取授权,可对高风险开发者进行针对审查,防范模型风险大规模扩散。

主动参与开源模型安全评估,并输出相应的报告或评估文件,确保符合行业安全基线开源方主动接受第三方权威的安全评估,并发布可验证的评估报告,有助于建立用户信任,并为监管机构提供技术参考依据。

发布指引告知模型可能的适用场景与局限性。清晰的风险提示是预防滥用的重要手段。Google 在发布Med-PaLM 模型时附带了详细的“Model Card”,强调该模型仅供医疗专业人员参考、禁止用于直接医疗诊断,列明其在医疗专业领域的准确率局限及潜在偏见表现。

开源后跟踪社区反馈及时迭代更新,发布更新或安全补丁,确保技术有序演进。阿里巴巴开源 Qwen3-235B-A22B 模型后,与开源社区积极沟通、认真考虑开发者反馈建议,决定除了提供混合思考模式模型,再分别训练Instruct和Thinking模型,以获得不同应用场景的最佳效果,成功优化并发布 Qwen3-235B-A22B-2507 模型

开源社区——负责任的组织

开源社区不仅是代码托管场所,更是连接开发者、促进协作、实施治理的核心枢纽,需承担起规则制定者与生态协调者的责任。

制定清晰、规范的开源项目上线和下载的规则、流程,并监督规则流程的执行。社区可要求所有模型提交者填写许可信息与用途、注意事项,并由社区进行合规性审查,确保上线质量。

鼓励和引导开源贡献者积极提供开源项目的版权归属、依赖库,提升许可协议的完整性和可追溯性。社区可通过结构化表单要求填写依赖库、引用模型及许可类型。GitHub 的 Dependabot 工具可自动扫描项目依赖关系,既可识别安全漏洞、也可提示潜在许可冲突,帮助开发者规避法律风险。

对模型或数据集执行必要的安全检测,识别可能存在的违法不良信息。ModelScope对社区上的模型、数据集、测试页面等,在发生更新时执行安全扫描,从多个维度识别风险,并及时进行处置。

建立社区反馈响应机制,跟进用户反馈,在收到投诉或提醒后即时调整和处置。GitHub 在收到有效的DMCA(《数字千年版权法》)删除通知后,会审查侵权行为是否存在,确认属实后将移除被投诉的侵权内容。仅2021年,GitHub即累计删除了近2万个项目。

开展技术博客、开发者论坛及培训课程等活动,向开发者传递模型使用规范、安全实践案例及最新政策动态,强化开源生态的协同治理能力社区可通过技术博客、线上课程与线下峰会传递最佳实践,协助开发者提升模型内生安全。

通过开源社区讨论及技术峰会等形式,促进安全工具链、评估方法及治理经验的开放共享,形成开源生态的协同创新生态。开源社区可推动建立“安全工具包”共享库,组织“开源治理圆桌会议”,促进不同项目间在评估方法、伦理框架与合规策略上的经验交流,形成协同创新的正向循环。

开发者——负责任地使用

开发者是开源技术落地的关键执行者,其行为直接影响技术应用的社会影响,必须强化责任意识与合规能力。

遵守开源方的协议约束和开源社区规范。应用产品公司可发布“使用声明”,注明其引用来源、修改内容及授权状态,推动形成尊重知识产权的社区文化。

负责任地选用开源模型,针对具体使用的场景和潜在应用风险充分测试和评估。对高风险场景的特殊处理,采用更先进的技术,以及更严格的加密或防护措施。如金融风控、医疗诊断等高风险场景,开发者应实施更严格的测试流程。微软在其 Azure AI 服务中引入“Responsible AI Dashboard”,支持开发者对模型进行公平性、稳健性与可解释性评估。

将开发应用过程中发现的开源模型风险反馈给开源贡献者和开源社区,协助降低开源模型的原生风险。让全球开发者成为开源模型的“质检员”,通过反馈帮助提升模型安全性,这种“自下而上”的反馈机制已是开源AI生态中一个积极且有效的实践,极大增强了开源模型的鲁棒性。

在面向公众提供应用服务时,依照法律要求承担技术支持者和/或服务提供者的合规义务,典型的义务包括AI生成物标识。依据中国《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等法律要求,开发者在将开源模型及衍生的定制化变体用于公众服务时,必须完成算法备案,落实AI生成内容标识,建立违法不良信息过滤机制,确保训练数据合法可追溯,并履行个人信息保护责任。同时,需设立用户投诉响应机制,防范虚假信息传播与AI滥用风险。



大模型具有“全球造、全球用”的技术本质,其发展天然依赖全球化协作。大模型能力根植于全球知识体系,通过多语言语料与共享算法实现跨文化理解与技术复用,体现人类文明的集体智慧;全球化带来显著的生态红利,包括技术普惠、标准统一、创新加速与市场绑定,中国的开源模型已凭借高性能和高衍生数量成为全球AI生态的关键力量;价值观适配是中国AI出海的重要挑战,需要在坚守中国立场的同时,实现对不同国家文化与法规的精准适配。大模型的全球化不仅仅是技术扩散,更是提升中国技术话语权、构建包容型数字文明的战略路径。


| 2.1 大模型是全球造、全球用的全球化工具,全球化是模型发展本能的诉求


大模型技术作为全球知识体系的集成载体,其发展本质是技术、数据与算力资源的全球化协作过程。大模型的诞生凝聚了人工智能领域几十年跨国合作的努力,大模型能力所必需的数据资源则源于多语言、多文化的训练数据集构建。大模型的发展集人类文明之大成、站在了全球智慧的肩膀上,这使得模型能够吸收人类文明的多样性智慧,具备了适应不同文化、不同地区人群需求的能力。我国开源模型的衍生模型数量领先全球、在各国广泛应用也印证了模型本身的国际应用潜力。全球应用能够为模型技术迭代优化带来更多样的需求,丰富的场景也能推动模型与应用的适配,带动人工智能上下游产业的高质量创新。积极鼓励我国大模型全球化,为模型全球应用扫除制度性制约,让全球更多国家和更多人群认可我国模型能力,并对模型背后的数字技术体系建立信任,对全球新一轮技术发展意义重大。


全球技术:模型能力源于世界知识的积累和协同创造


数据维度:多语言语料库的全球化融合


不同语言贡献高质量知识:全球范围内的知识积累以不同语言为载体,高质量的多语言语料对模型能力提升具有关键作用。借助跨语言迁移学习(Cross-Linguistic Transfer Learning),模型能够通过参数的共享,在源语言(Source Language)中学习到的语义、逻辑及推理能力,并迁移到目标语言(Target Language)中,在共享表示空间中实现知识的泛化与扩展,既突破单一语言的局限性,也在多种语言的知识体系中取长补短,形成更全面的模型能力。

文化包容性与公平性保障:模型通过多语言数据的多样性构建对全球知识体系的动态理解能力。例如,CulturaX数据集(6.3万亿标记,覆盖167种语言)确保模型在跨文化场景下具备一致的语义建模能力,避免因语言偏见导致的认知偏差。多语言训练数据的引入有助于降低模型对主流语言的依赖性,提升对低资源语言的适配能力,为模型提供多元文化背景下的语义表示,增强在全球化应用场景中的公平性与包容性。

算法维度:数学原理和算法框架是全人类共享的知识财富

数学原理:线性代数、概率论、微积分、优化理论等数学工具构成了深度学习、强化学习等算法的理论基础,其本质是全球统一的科学共识。数学原理的标准化特性确保了算法的可解释性与可复现性。

开源算法:深度学习、注意力机制、分布式训练等核心算法均为全人类共享的科学成果,其演进依赖于全球学术界与工业界的协同创新,这些算法是跨地域跨文化协同创新的实践成果。

全球生态:模型扩散的规模效应与生态优势

模型扩散得越广、用的人越多,越能打造生态优势和规模效应。模型的全球化带来技术、市场、基础设施、安全治理多方面的红利。

技术普惠与标准化:通过开源核心算法、共享训练框架与数据资源,降低模型使用门槛,推动模型接口、评估指标及部署框架的标准化,形成全球通用的事实技术标准。

技术发展的加速器:从“封闭式研发”到“全球开放式协同创新”。大模型的开源标志着人工智能技术演进路径的一次范式转变,构建起一个全球开发者广泛参与、多元主体协同创新的技术生态。这一模式有效激发了跨地域、跨领域的协作潜能,显著提升了技术研发的迭代速度与创新能力,推动人工智能进入普惠化、规模化应用的新阶段。

竞争优势的构建:从产品竞争到生态协同。开源模型的开放性为中国企业提供了差异化竞争策略。海外中小型企业使用免费开源工具链,降低其AI部署成本,从而在东南亚、非洲等新兴市场建立技术紧密合作关系。这种“技术赋能+生态协同”的模式,使中国企业避免了传统硬件出口的贸易壁垒,转而通过开源协议与全球用户共建互信、可持续的技术生态。

基础设施的全球化布局:依托云服务、边缘计算及异构算力的协同,建设服务全球的模型服务平台,模型训练与推理能力得以突破地域限制,实现全球范围内的高效部署与优化。

全球参与的治理机制:建立多方参与的开源社区治理架构,涵盖开发者、企业、政府及学术机构,通过透明化贡献机制与责任共担原则,增强了全球范围内的信任感,保障了生态的可持续性发展。

提升中国在全球科技界的话语权和影响力:作为多项高科技的结晶,大模型的规模扩散可以显著地突破全球科技格局中的垄断,使得中国在全球科技标准制定、方向规划、资源调配等方面,有更大的话语权和自由度。

中国模型的全球化发展:中国模型已成为全球AI生态的重要力量

中国开源力量正在成为人工智能开源国际舞台上的重要参与者、贡献者。根据Artificial Analysis截至2025年9月的LLM Leaderboard榜单,全球排名前100的开源模型中,来自中国的开源模型占有半壁江山,其中排名前10的开源模型中有9个来自阿里巴巴、深度求索、月之暗面、智谱等中国模型公司,体现出中国开源模型的强大实力;同时,中国开源人工智能项目的性能也受到了全球关注,中国的人工智能开源项目以相对较少的数量而获得了更多的“喜爱度”,每个中国人工智能开源项目得到的平均“喜爱度”位列全球第一。

图 Artifical Analysis开源模型榜单前10名(截至2025年9月)


中国开源模型也在全球获得更多选择。在全球开源社区,中国开源模型已获得了广大开发者的认可,形成全球生态影响力。以Qwen开源为例,截至2025年7月,其衍生模型数量已超过20万个,位居全球开源模型首位;在Hugging Face社区,2024年Qwen系列占全球模型下载量的30%以上,稳居第一,2025年2月Huggingface的开源大模型榜单显示,其排名前十的开源大模型全部是基于Qwen 开源模型进行二次训练的衍生模型。同时,中国开源模型也凭借其优秀的性能表现获得了海外初创公司的青睐,如日本初创公司Lightblue使用Qwen开源模型开发其日语大模型等。


| 2.2 大模型对不同文化的适配


开源模型通过面向全球用户开放体验,已成为中国人工智能技术全球化布局的重要实践路径。其核心价值在于通过技术中立性与生态开放性,突破传统技术壁垒,构建跨地域、跨行业的协作网络。


不同国家与地区的法规和文化存在明显差异


在全球化背景下,大模型的应用需适配不同国家与地区在伦理规范、数据安全、隐私保护、社会文化、法律法规、宗教政体等方面的差异化需求。


全球一模如何适配不同的文化


部分全球化大模型的既有做法


嵌入具有自我中心主义与文化偏见的价值观。某些模型在设计与训练过程中,以自身文化为中心评判其他文化,在涉及特定议题时表现出明显的偏见或歧视。这种做法虽可能提升输出内容在其原生语境下的一致性与可控性,但在跨文化应用场景中极易引发冒犯或冲突,削弱模型的全球适用性与包容性。


通过语言适配特定国家的文化。针对利益关系紧密国家的特定主题,部分模型会在不同的语言下给出不同的态度,偏向自己的“朋友圈”,与全球的共识不符,削弱了公平性。


不考虑不同发展阶段国家的法规和文化。部分模型并不考虑处在不同发展阶段国家的法律、社会背景与文化语境差异,导致其在这些地区的适用性较低,也影响全球人工智能发展的公平性与包容性。


中国模型出海可行的做法

越来越多的中国企业开始探索将自主研发的大模型推向国际市场,如何在坚持中国立场的同时,兼顾目标市场的文化背景与社会习俗,成为重要的议题。

坚持中国立场,发出中国声音,讲好中国故事。中国模型应坚持中国核心价值观,体现中华优秀传统文化和当代中国的时代精神。在国际用户的交互过程中,应积极传播中国理念。

用技术手段适配不同的文化。在与中国核心价值观不矛盾的前提下,兼顾目标市场的文化背景与价值诉求,尝试用技术手段适配不同的文化。

模型训练阶段增加特定文化的安全任务。在模型训练中引入基于不同文化的数据集作为安全任务,使模型具备识别并遵循特定价值导向的能力,增强模型对多元文化的理解与响应能力。

模型推理阶段通过引导和护栏组合的方式做适配。根据所在国家、query的语言,利用system prompt设定、user prompt改写等对模型的生成进行引导 + 安全护栏。可通过动态调整系统提示(system prompt)、用户输入重写(prompt rewriting)等方式,引导模型在不同语言下输出符合本地规范的内容。同时,结合安全护栏,通过特定话题规避、风险内容拦截等功能,确保模型输出内容既符合中国立场,又满足目标市场的合规要求。

扩大全球规模效应,做好开源信息共享,使得各项文化能在既有使用者中找到类似的最佳实践。各地文化虽有差异,但是整体存在几大文化圈共性(例如东亚文化圈等),随着全球规模化的提升,新的使用者会越来越容易在以往的最佳实践中找到参考,实现“复用+微定制”便能快速适配的良性循环。

构建一个适配多元文化的人工智能大模型,既是技术挑战,也是战略机遇。面对日益复杂的国际舆论环境与多元文化背景,中国模型在出海过程中可以秉持开放、包容、合作的态度,既要坚持自身立场,又要通过技术创新实现对不同文化的精准适配,在全球人工智能治理体系中发挥更大作用,推动构建更加公平、合理、包容的数字文明新秩序。



| 3.1 AI对经济社会的影响

从底层生产要素到生产力,再到生产关系,AI正以前所未有的深度和广度影响人类的经济社会形态。这一变革不仅体现在能源等基础资源的重新配置上,也深刻影响着企业的生产工具乃至个体的职业发展,催生出全新的组织形态、产业生态与商业模式。

AI技术的快速发展和应用渗透正深刻重塑我国电力等能源格局,对全社会能源配置提出更高效、更灵活的优化需求。随着大模型对算力的爆发式增长,GPU集群的能耗激增引发对电力保障与碳排成本的广泛关注。智算集群的规模化扩张推动碳排放快速攀升,冲击企业碳中和目标;同时,其高密度、高连续负载的用电特性与绿电发电的波动性之间存在结构性矛盾,电力负荷中心与新能源资源富集区在地理上存在显著错位。为应对AI带来的能源与环境双重压力,需构建适配AI训练与推理需求的全国协同电网体系,考虑到我国东西部在算力和电力上的资源禀赋差异,可在全国范围以“三级纵深”策略推进算电协同布局:首先是长三角、珠三角等东部沿海核心经济圈应用场景密集、时延敏感,应充分发挥海上风电资源并推动“核电长协直供”,为高可靠推理算力提供稳定清洁的电力保障;其次是西部清洁能源富集地区,则可以绿电为主的低成本能源供给,匹配超大规模算力集群,承担模型训练任务和时延不敏感的大规模推理;最后是中西部在能源结构上更具多元化的过渡地带,可采取“绿电+传统电能”的混合供给模式,平衡成本与效率,为区域性的大模型训练与推理提供支撑。这种基于地域的差异化配置策略,不仅能高效支撑AI产业发展,更可系统推动能源结构绿色转型,降低数字经济碳足迹,实现“绿色算力”新引擎与高质量产业升级的有机统一。

AI正通过一系列强大的工具和企业级应用,为千行百业的效率提升与业务创新注入强大动力,逐渐从“智力”跃升至“生产力”。在企业内部,集成AI能力的办公软件、代码助手、数据分析平台等工具,能够完成从基础问答、文本生成到信息检索、深度研究、软件开发与测试、图片编辑等各种任务,有效提高了工作效率。在企业运营层面,AI驱动的B端应用正在重塑业务流程。例如,在市场营销领域,AI帮助洞察消费者隐性动机与品味偏好,实现深度的用户理解与精准预测;在物流运输领域,AI可以优化库存、预测需求并规划最优物流路径,降低业务成本;在生产制造领域,AI则通过多模态识别能力帮助进行质量检测等。这些深度融合业务场景的AI应用显著提高了企业的运营效率与决策智能化水平,加速了产业的数字化转型。此外,智能体将AI的能力从被动响应升级为自主规划和主动执行,对于人类提出的需求,可以独立完成多步操作,最终向人类交付结果,进一步从“智力”向“生产力”进化

AI的飞速发展正在深刻改变个体的工作和职业前景,带来新的机遇和劳动力结构的转型。一方面,AI催生了一系列全新的、高价值就业机会,例如人工智能芯片研发人员、大模型算法工程师、人工智能伦理与治理专业人员等。从长远来看,AI将人从重复性、低价值的工作中解放出来,向新兴产业链或更能体现人类差异化竞争力的劳动力形态迁移,例如创意、策略制定、复杂问题解决和人机互动等领域。另一方面,AI工具的普及显著降低不同群体的就业门槛,提升就业机会的均等性和公平性。AI作为强大的辅助工具,能够帮助经验不足的劳动者更快地掌握新技能、提高工作效率和产出质量,从而在职场中获得更多机会。

AI技术也在深远地重塑组织的结构和边界,推动企业走向更灵活、高效的运营模式。对于组织结构而言,AI将促使传统的科层制组织向更加去中心化和扁平化的方向发展。AI工具能够显著提升个体的创造、决策和执行能力,缩小领导者与团队成员之间的能力差距,从而导致组织层级更少、管理幅度更大,决策也更大程度地向下授权。对于组织边界而言,AI将推动组织边界从刚性的、固定的实体转变为柔性的、适应性强的生态系统。这是由于:一方面,AI驱动的自动化工具和协同平台可以显著降低组织内部的协调成本,使得组织有可能在不增加管理负担的情况下扩张到更大的范围;另一方面,AI在信息匹配、风险评估等方面的能力,可以使市场交易变得更高效、更透明、成本更低,这可能导致更多的交易在市场内进行,从而使组织边界更具弹性。

| 3.2 AI对商业的影响

AI技术快速迭代、持续突破,让人们看到其在各行各业应用的无限可能和巨大潜力,特别是强调生产效率与生产成本、追求丰富且差异化供给、注重大数据处理分析的领域,例如网络交易、互联网营销、游戏、动画及影视剧制作等领域,已逐步探索出AI技术可落地应用的丰富场景。

AI技术优化供需匹配与生产效率,重塑商业格局。以网络交易领域为例,阿里巴巴升级覆盖AIGI(索引)、AIGR(推荐)、AIGB(出价)、AIGA(拍卖)、AIGC(创意)、AIGD(数据)等电商商业经营场景的AIGX技术体系,利用生成式AI技术识别分析消费趋势、潜在市场、搜索意图,为消费者推荐符合需求的商品,为商家提供符合市场的经营参考,实现海量商品供给与亿级消费需求的高效匹配。此外,阿里巴巴依托AIGX技术体系推出万相营造等智能创意生产工具,为超100万商家提供更低成本、更高效率的商品图、文、视频等内容生产制作能力,商家使用万相营造制作的素材相比商家原素材在大促期间的投放效率提升超15%,按商家传统素材拍摄制作成本预估,万相营造自上线以来已为商家节省创意制作成本累计超50亿元。AI在内容创作与金融、医疗、法律等领域的应用也在逐步加深,AI向生产力的跃升,必将带来新的商业模式与商业格局。

多模态大模型的发展与应用,将改变传统搜索流量分配格局。得益于大模型的语义理解和推理能力,生成式AI技术可以更准确地理解用户意图,且不同于传统搜索引擎返回的搜索结果列表,AI在检索到可用信息后直接分析、总结、生成最终内容,甚至可以基于用户授权代为操作执行。可以预见,当AI技术应用更为成熟,流量分配逻辑或将发生重大变化,由搜索推荐为主转向检索执行为主。举例而言,现在我们要购买一杯奶茶,需要“拿起手机-打开APP-搜索奶茶-点击链接-下单购买”,当智能体被广泛应用的时候,或将演变为“拿起手机(或其他终端设备)-发出指令‘下单一杯常喝的奶茶,最低价,半小时内送达办公室’”,用户不再有搜索-点击-下单动作。这一转变将直接影响流量入口与分配逻辑,影响网络内容生产、发布与运营策略,形成新的互联网发展生态。

应用AI技术在提升商业效率的同时,兼顾多方利益平衡。越高质量的、特别是垂直领域越专业的大模型,在具体商业场景落地的可能性也越大,相应地也更需要高质量的、专业的训练数据和行业理解输入,大模型长期进化发展离不开人类高质量知识和洞见的输入,需要探索多方共赢的合作模式。

(1)综合不同阶段投入成本、技术研发需要、训练数据商业价值及模型冲击影响等因素,分阶段、分类型探索商业合作模式。具体而言,通用大模型研究和训练阶段(包括模型优化训练阶段),具备更强的科学研究属性,模型整体技术的发展需要丰富多元的、大规模的训练数据,为提升语义理解能力、降低“AI感”,模型需使用大量的网络用户生产的非个人信息类数据。从鼓励创新与技术发展、提升模型通用性、保障模型理解多元文化价值角度,在数据使用方面应当更为包容,支持研发方在保障个人信息安全前提下,合理使用丰富多元的训练数据,推动大模型技术整体发展和性能提升。与通用模型不同,垂直领域或专业定制模型研发需使用高质量专业数据(例如金融知识库、医疗知识库等),考虑后续模型实际服务应用场景可能对相关领域产生一定替代性效果,对原始数据的“市场价值”造成不同程度的冲击,且此类模型往往更容易落地执行产生商业化收益,应更多关注数据来源的合法性,鼓励以付费合作等方式保障相关方利益共享。

(2)探索更多AI技术应用变现模式,以有效的价值归因作为利益分配的前提:当前收费模式主要包括会员费、API接口技术服务费、部分尝试嵌入付费推广信息等。未来模型技术及应用服务提供方也将探索更多变现模式,例如新的流量入口、新的付费推广模式等等,这需要更强大的模型能力保障,也需要更优质的训练数据支撑。AI技术应用变现获取更多收益后,合理的价值分配有赖于技术上可识别判断商业价值归因,确定收益来源于内容艺术性(艺术性来源于使用者、特定训练语料或其他),抑或内容所依附的商品、服务等,以确保按实际贡献价值合理分配各方收益。

3.3 坚持长期价值建设,引导AI技术应用向上向善



AI技术中立,但AI技术的应用受人为设定目标的影响,应当避免AI应用“唯短期利益是图”。部分平台利用短视频受众数据分析,识别潜在消费人群心理特征,根据分析识别结果定向训练特定人设AI,为平台内违规经营卖家提供服务,例如打造容易让人误认为医生、新闻主播、老板娘、非遗传承人等特殊人设的AI形象,匹配符合人设的特殊场景,支持违规经营卖家批量生产AI内容,误导平台用户,滥用AI技术谋取短期商业利益,长此以往必将损害AI技术的创新、发展。此外,不乏短视频博主等为快速涨粉、吸引流量,滥用AI技术制造虚假、猎奇内容,批量生产虚假新闻信息、冲突性内容、悲惨图片等,以此迎合平台算法特征实现利用流量获利的短期目的。诸如此类滥用AI工具的行为虽能为平台、违规经营卖家、博主等带来非法收入、流量等短期利益,但已背离AI技术发展应用初衷,直接或间接地刺激低劣内容的生产,不利于社会长期健康发展,也不利于AI技术长期持续创新。


我们可以更好地利用AI技术强化引导正能量内容的生产、识别和分发:


建立文本、图片、视频等不同模态的内容特征识别和质量评价标准,从底层教会AI识

别、生产高质量内容互联网领域利用算法技术测试、分析用户行为数据,而猎奇、冲突、低俗等内容往往容易引发用户的点击、停留、评论、关注等行为,用户行为特征影响流量分发,流量分发不断强化用户行为特征形成受众视角的信息茧房,用户偏好被不断强化,导致价值观偏激或低质内容形成闭环的生产、传播链条,理性声音逐步被边缘化。得益于大模型技术发展,我们可以教会AI更多维度地理解内容、评估内容质量。具体而言,可以从AI研发环节入手,拆解正能量内容特征,分析、抽取文本、音频、图片、视频等不同模态的特征要素,逐步分解到数据标签和语义结构,构建正能量内容打分模型,形成机器打分与人工监督修正的正循环,帮助AI有效识别、生产正能量内容。未来应当进一步将内容平台商业目标融入社会舆论环境构建目标,重建“流量逻辑”与“质量逻辑”的平衡,推动内容生态不再依赖人性的弱点牟利,使其真正成为进步思想的载体,而非撕裂社会的推手。 


推动AI技术多维度、多指标分析用户行为特征,增加社会价值衡量指标,引导AI为用户匹配丰富多样的正能量内容。利用AI技术识别分析正能量内容账号特征、权威内容特征,例如具有新闻媒体采编权的媒体账号、专业资质认证账号,又如权威人物、地点、事件类型特征分析识别等,在账号识别基础上按照内容重要权威程度识别给予不同权重,且可以利用AI技术参照传统媒体分析内容题材深度、题材角度、策划角度等方向指标和权重设置,将预判焦点内容、是否独家、是否深入调查、独到见解、受众面广泛等人工经验植入AI,更高效、更多维度分析内容,为深度报道、科普创作等正能量内容提供流量激励,提升正能量内容的传播。此外,还可利用AI技术更高效识别恶意制造冲突、低质量重复内容特征,并限制流量、降低权重,减少低质量内容传播。

持续优化AI技术长期目标,保障高品质、多样性、强信用的内容及商品服务获得优势竞争地位,实现AI对于社会发展的正向引导和促进作用。例如电商场景将“商品复购率”“评论综合搜索量”“销售额”“好评率”“回购率”“质量评分”“退货率”“新颖度”等更能真实体现商品服务质量的指标,作为利用AI技术分发流量的评价指标,又如设定“新品”“新商”“高评分商品”“小众或原创设计”等的浮现机制或固定曝光位,以鼓励商品服务创新性、多样化,再如利用AI语义理解、推理分析等优势,更多维度的识别用户真实的、多样化的需求,为用户提供更优质更多元的选择。



🌟下期预告

第五章《合作:聚力政产学研,共建安全、向善、可持续的AI发展范式》
图片

AI治理这条路才刚刚开始,阿里巴巴持续给出自己的答卷,连续四年发布人工智能治理知识产品,为行业提供前瞻指引。我们不是在写一份份孤立的报告,而是在系统性构建面向未来的AI治理知识基础设施。
👇点击下方【阅读全文】查收电子版全文



📌往期推荐

图片AAIG课代表,获取最新动态就找她👇
图片

关注公众号发现更多干货❤️

图片
图片
图片

内容中包含的图片若涉及版权问题,请及时与我们联系删除