前沿AI模型越来越大,无论是对于企业还是个人,AI模型的训练成本都越来越高。即使花巨资使用超级计算机集群,聘请专家,也难以实现AI模型的高效训练。
针对这一行业痛点,潞晨科技发布大规模并行AI训练系统——“夸父”(Colossal-AI) ,通过多维并行、大规模优化器、自适应任务调度、消除冗余内存、降低能量损耗等方式,旨在打造一个高效的分布式人工智能训练系统,作为深度学习框架的内核,帮助用户在最大化提升人工智能训练效率的同时最小化训练成本。目前,夸父AI为抢先体验beta版,正式版将在近期发布。
夸父AI系统最终结构
论文地址:
https://arxiv.org/abs/2110.14883
项目地址:
https://github.com/hpcaitech/ColossalAI
文档地址:
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢