1、一块GPU训练TB级推荐模型不是梦,OneEmbedding性能一骑绝尘
https://mp.weixin.qq.com/s/e849TWDD-dS8Q3G-zgy6NQ
2、Geoffrey Hinton:深度学习的下一个大事件
https://mp.weixin.qq.com/s/ryxvfA9hoc8TZuELLRezdA
3、AI-GPU显存优化领域前沿工作发展史
https://zhuanlan.zhihu.com/p/536940298
4、面向ASIC设备的编译器框架:TVM or MLIR?
https://zhuanlan.zhihu.com/p/513872467
5、深入理解TVM:Python/C++互调(上)
https://zhuanlan.zhihu.com/p/363991566
6、浅谈GPU通信和PCIe P2P DMA
https://zhuanlan.zhihu.com/p/430101220
7、Welford算法小记
https://zhuanlan.zhihu.com/p/408474710
8、Uni-Fold 升级开源!完成PyTorch迁移,支持复合物训练,训练加速2.2倍!
https://mp.weixin.qq.com/s/_6uCCZxIm1t1PzKL6kj33g
9、由浅入深了解Diffusion Model
https://zhuanlan.zhihu.com/p/525106459
10、OpenMLDB + OneFlow: 手把手教你快速链接特征工程到模型训练
https://mp.weixin.qq.com/s/dF7xExYaiWVi0BttQ0mFXg
其他人都在看
- OneFlow v0.8.0正式发布
- 18张图,直观理解神经网络、流形和拓扑
- OneFlow源码解析:Op、Kernel与解释器
- Geoffrey Hinton:深度学习的下一个大事件
- 分布式深度学习编程新范式:Global Tensor
- LLVM之父:为什么我们要重建AI基础设施软件
- 大模型训练难?效率超群、易用的“李白”模型库来了
欢迎体验OneFlow v0.8.0:https://github.com/Oneflow-Inc/oneflow/