点击蓝字 关注我们
AI国际治理观察周报

外交部:中方愿同各方就人工智能全球治理开展沟通交流与合作
11月28日下午,外交部发言人汪文斌在例行记者会上表示,习近平主席在第三届“一带一路”国际合作高峰论坛开幕式上宣布中方提出《全球人工智能治理倡议》,得到国际社会的高度关注和积极评价。中方愿以落实《倡议》为契机,同各方就人工智能的全球治理开展沟通交流、务实合作,确保人工智能始终朝着人类文明进步的方向发展。
汪文斌介绍,各方普遍认为,《倡议》充分彰显人类命运共同体理念,契合各国发展人工智能的现实需要,为推动人工智能健康安全有序发展作出了独特贡献。一些发展中国家认为,人工智能规则制定不能仅由少数发达国家说了算,应增强“全球南方”在人工智能领域的话语权,推动构建公平、公正的人工智能国际治理体系。不少国家表示,期待同中方加强在人工智能领域的交流合作。
来源:外交部官网
青海昆仑人工智能算力中心正式揭牌并启动运营
11月30日上午,由中共城西区委、城西区人民政府主办的青海昆仑人工智能算力中心揭牌仪式在西宁锦诚大厦举行。这标志着青藏高原第一座智算中心正式揭牌并启动运营。
活动现场,与会嘉宾参观青海昆仑人工智能算力中心办公、展厅区域和北京升哲的研发成果。青海昆仑人工智能算力中心依托三江源国家大数据基地,实现算力资源的托管运营。此次青海昆仑人工智能算力中心揭牌及签约仪式的成功举办,标志着城西区在打造算力产业、发展数字经济方面迈上了新的台阶。未来,城西区将以人工智能、物联网、大数据等新一代信息技术在西宁乃至青海的深度应用和融合发展为基础,全力打造算力产业与数字经济新生态。
来源:新华网

2027年我国人工智能服务器市场规模将达134亿美元
11月29日,2023人工智能计算大会(AICC)召开,会上国际数据公司IDC和浪潮信息联合发布《2023—2024年中国人工智能计算力发展评估报告》。报告预计,2023年中国人工智能服务器市场规模将达91亿美元,同比增长82.5%,2027年将达到134亿美元,年复合增长率达21.8%。
报告认为,人工智能正在加速从感知智能向生成式智能迈进,人工智能算力需求也因此快速增长。报告预计2022—2027年中国智能算力规模年复合增长率达33.9%,通用算力规模年复合增长率为16.6%。
报告称,中国企业对生成式人工智能的接受度普遍较高。据调研,67%的中国企业已经开始探索生成式人工智能在企业内的应用机会或已经开始进行相关资金投入。中国企业尤其认可生成式人工智能在加速决策、提高效率、优化用户和员工体验等维度带来的价值,并将在未来三年持续提高投入力度;但与此同时,企业需要直面计算、存储等资源短缺,行业大模型可用性待提升以及投入成本高等问题带来的压力。
报告指出,中国人工智能技术正加速迈入全面应用时代,2023年人工智能的行业渗透度排名前五的行业依次为互联网、电信、政府、金融和制造,其中,电信从上一年的第四跃升至第二。报告显示,过去五年(2018—2022年),北京、杭州、上海、深圳、广州、合肥、苏州、重庆等城市在人工智能领域具有较为突出的表现。受到生成式人工智能、智能计算中心投入的影响,2023年中国人工智能城市评估排行榜发生变化,北京依然位居首位,杭州和深圳分别位列第二位和第三位。此外,位居前十的城市还有上海、苏州、广州、济南、合肥、重庆和成都。
来源:科技日报
《北京市人工智能行业大模型创新应用白皮书(2023年)》发布 北京人工智能大模型创新团队数量约占全国一半
11月29日,AICC 2023人工智能计算大会举办。北京市科委、中关村管委会在大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)。
《白皮书》指出,北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,现已拥有大模型创新团队122家,数量居全国首位,约占全国的一半。《白皮书》同时也从模型演进、应用领域、应用类型、商业模式等多个角度详细梳理了现阶段北京市大模型应用的典型特点。
《白皮书》对北京市大模型应用案例进行了梳理,从政务、金融、医疗、传统产业赋能、文化旅游、智慧城市等六个行业领域切入,围绕创新性、示范性、经济与社会效益性、可推广性等四个维度,选取18个典型案例,详细分析了各领域用户需求、解决方案、项目成果。
基于案例分析,《白皮书》也进一步提出了目前大模型应用落地面临的挑战:一是算力资源供不应求,成为大模型企业创新研发的重要挑战;二是高质量数据成为严重掣肘大模型行业应用的症结;三是大模型幻觉问题有所改善,但离规模落地尚有差距;四是大模型应用存在“蹭热度”和同质化情况。
来源:人民网

加速行业智能升级 华为云推出首个大模型混合云
11月30日,以“践行深度用云,加速智能升级”为主题的华为云行业高峰论坛2023在北京举办。会上,华为云推出业界首个大模型混合云,并发布《深度用云展望 2025》白皮书及深度用云行动计划,旨在通过创新技术、理论沉淀及行动举措,助力政企践行深度用云,加速智能升级。
据华为混合云总裁尚海峰介绍,华为云Stack 8.3在业界率先实现大模型能力基于混合云部署,提供算力平台、云服务、开发套件和专业服务等完整的AI生产链,帮助政企客户一站式建立专属大模型能力,并针对大模型场景做了四大优化:基于原生混合云能力,用户可以将大模型从本地延伸到边缘和公有云,实现全场景跨云部署;通过软硬协同实现算子融合与混合精度的优化,模型训练性能提升45%;高效完成数据清洗、模型开发和应用开发,降低开发门槛;通过无感断点续训的能力,让AI训练长稳运行30天以上。
此外,华为云全球市场营销与销售服务总裁石冀琳在会上提出五点思考:深度用云就是从帮助企业应用云资源,到帮助企业应用云上的技术与服务;从帮助企业搭建全新的平台底座,到帮助企业进行应用现代化改造;从使用云上的通用技术,到开发行业化解决方案;从提升企业的运维能力,到提升企业的运营能力;从帮助企业提升效率,到打造全新的面向未来的核心竞争力。
来源:人民网
浪潮信息发布源2.0基础大模型,千亿参数全面开源
11月27日,浪潮信息发布“源2.0”基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
在算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。
在数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。
在算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。
当前,源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。
来源:人民网

安全设计 安全开发 安全部署 安全运维



清华大学人工智能国际治理研究院编
上述信息均根据原文内容整理,谨供读者参考,不代表本机构立场和观点

往期回顾
主理人:刘典
关于我们
清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。
新浪微博:@清华大学人工智能国际治理研究院
微信视频号:THU-AIIG
Bilibili:清华大学AIIG
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢