在第二届北京智源大会“智能体系架构与芯片论坛”上,美国南加州大学钱学海做了题为《去中心化分布式训练系统》的主题演讲。
钱学海,美国南加州大学电子工程系助理教授,于2013年获得伊利诺伊大学香槟分校博士学位,并在加州大学伯克利分校从事过博士后研究工作。曾荣获首届北美计算机华人学者协会新星奖和NSF CAREER AWARD。在ISCA、ASPLOS、MICRO、HPCA四个主要体系结构会议发表论文37篇,并进入ASPLOS和HPCA的名人堂(Hall of Fame)。钱学海研究团队的网站是:http://alchem.usc.edu。
在本次演讲中,钱学海系统地介绍了他和他团队近期关于去中心化的同步和异步算法的分布式训练系统设计的相关研究工作。钱学海介绍,当前流行的机器学习系统大都采用中心化和同步的并行训练,造成了通讯的瓶颈并容易受异构运行环境的影响,针对这个问题,他们提出了有效的去中心化分布式训练的系统设计方法。对同步执行,钱学海团队利用执行状态差别和通信图的关系,设计了系统资源控制的同步协议;对异步执行,他们则提出了一种新的通信原语和避免系统等待的有效方法,使得机器学习系统能有效地消除通信瓶颈并达到和当前集中式训练相当或更好的性能。下面是智源编辑为大家整理的讲座内容。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢