1、DeepMind发布媲美普通程序员的AlphaCode

 

DeepMind 与 OpenAI 两个知名 AI 研究机构分别发布重要研究成果:DeepMind 发布了基于 Transformer 模型的 AlphaCode,可以编写与人类相媲美的计算机程序;同时,OpenAI 开发的神经定理证明器成功解出了两道国际奥数题。

 

链接:https://mp.weixin.qq.com/s/evIZTPGHDJlo8Xee20j56A

 

2、阿里 BladeDISC 深度学习编译器正式开源

 

随着深度学习的不断发展,AI模型结构在快速演化,底层计算硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对计算框架的持续迭代。深度编译器就成了应对以上问题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化性能的人力开发成本,进一步压榨硬件性能空间。阿里云机器学习PAI开源了业内较早投入实际业务应用的动态shape深度学习编译器 BladeDISC,本文将详解 BladeDISC的设计原理和应用。

 

链接:https://zhuanlan.zhihu.com/p/462641670

 

3、TensorFlow 2.8.0正式上线

 

近日 TensorFlow 官方发布了 2.8.0 正式版,距离上次 2.7 版本的更新过去没多久,新版本提供了更多的 bug 修复和功能改进,此外新版本还针对漏洞发布了补丁。

 

链接:https://mp.weixin.qq.com/s/FwrqPED66Nd-a2akMtrJBA

 

4、AI系统全栈技术思考与展望

 

探讨了从软硬件全栈角度思考AI系统技术的必要性,包括在性能,易用性以及TCO方面的收益。结合一些具体示例,讨论了软硬件co-design对AI系统性能提升可能带来的潜力。通过一些实际的用例,探讨了AI软件全栈不同模块之间的相互影响,突出了其系统全栈设计的核心点。并以MLPerf为例,讨论了面向特定计算评测基准的极致性能优化和用户开箱可用自动优化的联系及矛盾。在这些讨论之外,我们也探讨了公司及行业层面的组织架构设计对AI系统技术架构演进的影响,以及AI核心软件栈和MLOps的联系。

 

链接:https://zhuanlan.zhihu.com/p/462810001

 

5、专用架构与AI软件栈(5)

 

以auto tensorize为核心的解耦新思路,通过解决这个问题来实现DSA硬件和上层应用的解耦合,最终希望实现的场景是前端用户写串行标量代码描述业务逻辑,后端算子开发人员/芯片厂商写算子/指令的功能描述(串行标量形式)和算子的实际实现/指令的实际调用方式两部分,编译器要解决的则是尝试在以算子/指令的功能描述形式为目标,寻找用户代码的等价变换,从而实现前端、后端和编译器三者的解耦合。

 

链接:https://zhuanlan.zhihu.com/p/458544969

 

6、Ion Stoica:做成Spark和Ray两个明星项目的秘笈

 

Spark和Ray不仅是业界影响力很大的开源项目,它们都以开源项目为基础发展成为商业上非常成功的公司。他们一定是做对了一连串难而正确的事才有今天,他们到底做对了什么?在机器学习节目《Gradient Dissent》中,主持人Lukas Biewald与Ion Stoica进行了一场深度访谈,从中我们可以通过第一手资料了解到发起Spark和Ray、成立创业公司、重视开源、拥抱云这一系列关键决策是怎么做的。通过这篇文章,希望朋友们能找到Spark和Ray成功的秘笈。

 

链接:https://mp.weixin.qq.com/s/pfl5Kp29ECWsxsYAV-PR9g

 

7、深度学习框架如何优雅地做算子对齐任务?

 

这篇文章介绍了OneFlow的算子AutoTest框架,提供了一个深度学习优雅地做算子对齐的方法,使得开发者和用户可以像写PyTorch那样方便写测试程序。

 

链接:https://mp.weixin.qq.com/s/Vb9zHOwnPn-19ZF-sKC3hg

 

8、PyTorch显存机制分析

 

两年过去了,也没有一篇很好的文章来总结PyTorch的显存机制的方方面面,这次为PyTorch的显存机制做个小的总结吧。

 

链接:https://zhuanlan.zhihu.com/p/424512257

内容中包含的图片若涉及版权问题,请及时与我们联系删除