2021年1月19日
谷歌提出「元伪标签」半监督学习方法,将ImageNet的top-1提升到90.2%
近日,谷歌大脑研究科学家、AutoML 鼻祖 Quoc Le 发文表示,他们提出了一种新的半监督学习方法,可以将模型在 ImageNet 上的 top-1 准确率提升到 90.2%,与之前的 SOTA 相比实现了 1.6% 的性能提升。
Quoc Le 介绍称,为了实现这一结果,他们使用了一种名为「元伪标签(Meta Pseudo Label)」的半监督学习方法来训练 EfficientNet-L2。
和伪标签(Pseudo Label)方法类似,元伪标签方法有一个用来在未标注数据上生成伪标签并教授学生网络的教师网络。然而,与教师网络固定的伪标签方法相比,元伪标签方法有一个从学生网络到教师网络的反馈循环,其教师网络可以根据学生网络在标记数据集上的表现进行调整,即教师和学生同时接受训练,并在这一过程中互相教授。 这篇有关元伪标签的论文最早提交于 2020 年 3 月,最近又放出了最新版本。
论文链接:https://arxiv.org/pdf/2003.10580.pdf 代码链接:https://github.com/google-research/google-research/tree/master/metapseudolabels
在新版本中,研究者针对元伪标签方法进行了实验,用 ImageNet 数据集作为标记数据,JFT-300M 作为未标记数据。他们利用元伪标签方法训练了一对 EfficientNet-L2 网络,其中一个作为教师网络,另一个作为学生网络。最终,他们得到的学生模型在 ImageNet ILSVRC 2012 验证集上实现了 90.2% 的 top-1 准确率,比之前的 SOTA 方法提升了 1.6 个百分点(此前 ImageNet 上 top-1 的 SOTA 是由谷歌提出的 EfficientNet-L2-NoisyStudent + SAM(88.6%)和 ViT(88.55%))。
GPT“高仿”问世:GPT-Neo,最大可达GPT-3大小,已开源
近日,有个名叫 EleutherAI的团队(创始成员为:Connor Leahy,Leo Gao和Sid Black),宣布推出GPT-Neo开源项目,可用于复现GPT系列的各种语言模型,也包括GPT-3。
作者表示,目前他们已经成功制造出GPT-2大小的模型。从项目代码的可扩展性来看,他们预计可以复刻出GPT-3大小的语言模型,甚至比GPT-3更大。不仅如此,由于这是个开源的项目,大家还可以自主训练这些模型(将来也会包括GPT-3)。目前,作者已经给出了详细的训练步骤。
本质上,GPT-Neo有点像是GPT系列的“高仿”项目:GPT-Neo中的各种模型,设计原理接近GPT系列,但代码并不一样。作者们打算尝试各种结构和注意力类型,最终扩展出GPT-3大小的大语言模型。为了实现这一目标,他们从复现GPT系列的模型开始,不断尝试各种模型架构、和各种注意力机制的实现方式。 这里面,融合了各种让模型变得“更大”的研究:例如,多任务学习方法MoE(Mixture of Experts),采用多个专家的结构,将问题空间划分为同质区域,然后采用分发器,决定问题应该问哪些专家。又比如,具有线性复杂性的自注意力机制等。 项目地址:https://github.com/EleutherAI/gpt-neo
智源学者陈文光荣获2020年“CCF杰出贡献奖”
1月18日,中国计算机协会(CCF)发布公告,决定授予智源学者、清华大学陈文光教授2020年“CCF杰出贡献奖”,以表彰他为CSP的权威性、专业性做出的杰出贡献。
“CCF杰出贡献奖”奖励对CCF有独特或重大贡献;就重大问题提出独到观点或建议被CCF采纳并产生良好效果;发起并组织CCF有影响力的新的系列学术会议;推动学会与其他组织合作,促进了CCF的发展;向学会提供大额捐赠或资助;有其他独特或重大贡献的个人或单位。该奖于2010年设立。
陈文光,国内系统研究的领军人物之一,中国计算机学会副秘书长,曾任ACM中国理事会主席、ACM中国操作系统分会ChinaSys主席、ACM 通讯中文版主编等。 陈文光研究概况(转自清华大学计算机科学与技术系的陈文光个人主页): 我长期研究高性能计算编程模型和编译系统,近几年在以图计算系统为代表的新一代大数据处理系统方面取得了进展。 2014年提出并实现了一种单机图处理引擎GridGraph,通过一种基于源和目的节点双层混洗的图数据结构,能够高效利用外存放置图的边,从而实现在单机上处理十亿结点以上的图。GridGraph性能比国际上同类单机图处理引擎如X-STREAM和GraphChi性能提高了一个数量级,论文在USENIX ATC 15上发表。 2016年初,进一步研制成功了名为”双子座“的分布式图计算系统,通过稀疏/稠密双模式计算引擎、稀疏性敏感的紧凑数据结构以及细粒度动态负载平衡等技术,在典型大数据分析应用(如PageRank, ALS等)上的性能是国际同类图计算系统PowerGraph和PowerLyra的十倍以上,是目前流行的大数据系统Spark性能的100倍以上,占用内存仅为其十分之一。论文在OSDI 16上发表。 上述系统软件已在github上开源:https://github.com/thu-pacman
通过北斗卫星定位和AI技术,中国在全球首次实现集装箱码头自动化
1月17日,在天津港集装箱码头自动化驾驶示范区内,25辆无人驾驶电动集装箱卡车成功在全球首次实现集装箱码头无人自动化的实船作业。无人驾驶电动集装箱卡车按照预设指令在自动化轨道桥下精准对位,装载集装箱后从自动化堆场自动驾驶,有序经过自动加解锁站,在北斗导航系统的指引下,按照实时测算的最优行驶线路,停靠到预定地点。然后,由远程控制自动化岸桥,从无人驾驶电动集卡上抓取集装箱,稳稳落在集装箱货轮上,整个流程中没有一名现场工作人员。
集装箱码头自动化升级,有3项关键技术:高精度卫星定位、自动驾驶,远程设备操控。 通过精准的定位,将指定的货物精确地放置在特定的位置,是码头自动化运转的前提。2020年6月23日,北斗系统第55颗导航卫星成功发射。至此,标志着我国建成了独立自主、开放兼容的全球卫星导航系统。
另一方面,自动驾驶技术逐渐成熟,并在货物运输领域率先实现大规模商用。以天津港为例,装载集装箱的货运车依据系统规划的行驶路线,可以精准停靠在预定地点。 远程设备操控,对网络带宽、延迟、稳定性都有很高的要求,这就需要5G网络的支撑。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢