汇聚每周AI观点、研究和各类资源,不错过真知灼见和重要资讯!欢迎点击这里,关注并订阅智源社区AI周刊。

编辑精选

  1. 美官方要求英伟达、AMD禁止向中国出售高性能AI芯片

美国芯片设计巨头英伟达被美国政府要求限制向中国出口两款被用于加速人工智能任务的最新两代旗舰GPU计算芯片A100和H100。

9月1日,英伟达在SEC文件上官方确认此事,称是8月26日收到美国政府的通知,并在声明中警告此事的影响:由于受影响芯片涉及在中国约4亿美元的潜在销售额,如果客户不愿购买英伟达的替代产品,或者美国政府不肯授予许可,将使英伟达收入盈利大幅下滑。AMD同样被要求限制向中国出口其MI250人工智能芯片,但它相信其MI100芯片不会受到影响。

这些规则同时适用于中国和俄罗斯。评论认为,美国此举可能会削弱中国公司开展人工智能相关先进工作的能力,并影响英伟达和AMD数据中心业务的收入。英伟达在SEC文件中披露,计划申请豁免,但“不保证”美国官员会批准。他们正与中国客户接触,以满足他们计划或未来购买替代产品的需求,并会在替代产品不足的情况下寻求许可。目前,英伟达向美国申请的高端芯片出口豁免已获得通过。可以在明年3月前继续向美国客户出口(到中国)的产品提供A100,可以在明年9月前继续履行A100和H100的订单。

  1. 通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”

近日,微软亚洲研究院联合微软图灵团队推出了最新升级的 BEiT-3 预训练模型,在广泛的视觉及视觉-语言任务上,包括目标检测(COCO)、实例分割(COCO)、语义分割(ADE20K)、图像分类(ImageNet)、视觉推理(NLVR2)、视觉问答(VQAv2)、图片描述生成(COCO)和跨模态检索(Flickr30K,COCO)等,实现了 SOTA 的迁移性能。BEiT-3 创新的设计和出色的表现为多模态研究打开了新思路,也预示着 AI 大一统渐露曙光。

近年来,语言、视觉和多模态等领域的预训练开始呈现大一统(Big Convergence)趋势。通过对大量数据的大规模预训练,可以更轻松地将模型迁移到多种下游任务上。这种预训练一个通用基础模型来处理多种下游任务的模式已经吸引了越来越多科研人员的关注。首先,骨干网络逐渐统一。模型架构的统一,为预训练的大一统提供了基础。此外,通过模块化的设计,统一架构可以用于不同的视觉及视觉-语言下游任务。

其次,基于掩码数据建模(Masked Data Modeling)的预训练已成功应用于多种模态,如文本和图像。图像-文本对可以被用作“平行句子”来学习模态之间的对齐。通过数据的归一化处理,还可以利用生成式预训练来统一地进行大规模表示学习。第三,扩大模型规模和数据大小可提高基础模型的泛化能力,从而提升模型的下游迁移能力。

  1. 资深数据科学家撰文:企业系统性评价MLOps发展程度的七个阶段

MLOps的定义取决于受众。对于技术从业者,MLOps 是特定于数据科学生命周期的 DevOps任务的自动化。对于关心跨组织规模的高管,企业MLOps是一组技术和最佳实践,可简化数据科学模型的管理、开发、部署和维护在一个多元化的企业中的规模化。MLOps可以加快公司生产模型的速度,同时确保模型安全性、安全性和准确性的最高标准。

怎样判断MLOps的成熟情况?作者提出了七个阶段,分别是加速研究,高效部署,达到先进的AI解决方案,建立模型安全网,实现标准化、深度协作、流水线的审核、快速投入使用,优化模型质量并降低风险,以及可重复获得的利润和安全AI。

观点

  1. Judea Pearl批判Michael Jordan论文:不是所有随机对照实验都叫“反事实”
  2. 腾讯首席科学家张正友寄语青年人:做好研究和技术需要的“W.T.O.”理论
  3. 吴恩达:中国的丰厚AI投资回报将在接下来十年显现
  4. 华为天才少年谢凌曦:关于视觉识别领域发展的个人观点

研究前沿

  1. 字节AI Lab提出的新多语言多模态预训练方法刷榜,已开源
  2. 斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键
  3. 自学成才的人工智能显示出与大脑工作方式的相似之处
  4. 网易伏羲提出 135 种人脸表情划分标准,登 IEEE 官网

科学家

产业

  1. 天数智芯推出DeepSpark通用开发平台
  2. AI Grant创业计划征集AI-first项目,含25万美元现金和同等价值云服务等

活动

  1. 报名 | 旷视天元 MegEngine:推动低比特量化技术的落地(旷视研究院,9月2日)
  2. 报名 | 微软亚洲研究院王晋东:构建更鲁棒的机器学习系统(MLNLP,9月3日)
  3. 报名 | 谷歌研究科学家夏斐:基于语言和视觉模型的规划以实现具身推理(智源,9月7日)
  4. 报名 | 电子科技大学顾实:脑与脑启发神经网络的模块化特征(青源会,9月8日)
  5. 视频回放 | 2022智源大会全体大会及各分论坛视频上线

求职招聘

  1. 智源研究院 | AI for Science方向研究员,探索生命科学前沿,解决世界级科研问题
  2. 智源研究院 | 分子动力学方向研究员,研究生物大分子动力学模拟,实现分子结构功能的预测泛化
  3. 智源研究院 | 类脑智能方向研究员,追踪国际前沿文献,研发具有生理功能的大规模高精度神经网络模型

教程

  1. 陈天奇CMU新课程线上免费听,剖析DL框架底层原理,学完你也能开发mini版PyTorch/TF
  2. 最新《自动化机器学习》报告,附书籍

查看预训练、强化学习等领域周刊内容,欢迎点击这里

招聘、活动、推广等合作,请联系:editor@baai.ac.cn