导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第50期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。 

过去一周(2020/11/30~2020/12/06),值得关注的内容有以下3方面:

  1. 2020年11月30日,DeepMind官网宣布,其新一代AlphaFold人工智能系统,在国际蛋白质结构预测竞赛(CASP 14)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。对这一结果,《Nature》直接发文称:It will change everything。(详情参见本周报“应用”栏目)
  2. 颜宁教授认为,这次新闻的亮点主要有二,一是AI,二是准确度高。这确实是突破,但是有了两年前的新闻做铺垫,现在这次委实是意料之中。结构生物学的本质不是解结构,是理解生命、回答问题,做出生物学发现。(详情参见本周报“观点”栏目)
  3. 近日,人工智能顶会AAAI 2021已经开奖,共有1692篇论文被接收,录取率21%,比去年的20.6%稍微有些上升。单从数量上看,也比去年多了101篇。本届AAAI采用两轮审稿政策,共收到9034篇投稿。(详情参见本周报“会议”栏目)   下面是各个要点的详情介绍。

论文推荐 南加州大学 | 使用浅层采样器的深度图神经网络 Deep Graph Neural Networks with Shallow Subgraph Samplers 尽管图神经网络(GNN)是用于学习图上表示的强大模型,但大多数最新模型在两到三层之外都没有明显的精度提高。深度GNN基本上需要解决:过度平滑造成的表达挑战和邻里爆炸带来的计算挑战。作者提出了一种简单的“深层GNN,浅层采样器”设计原理,以提高GNN的准确性和效率-为了生成目标节点的表示,作者使用深层GNN仅在浅层,局部子图中传递消息。正确采样的子图可能会排除无关或什至有噪声的节点,并且仍然保留关键的邻域特征和图结构。然后,深层GNN对信息丰富的局部信号进行平滑处理以增强特征学习,而不是将全局图形信号过度平滑化为仅“白噪声”。作者从理论上证明了为什么将深层GNN与浅层采样器结合使用才能产生最佳的学习效果。然后,作者提出了各种采样算法和神经体系结构扩展,以取得良好的经验结果。在五个大型图形上进行的实验表明,与最新技术相比,本文的模型具有更高的准确性和效率。 论文下载 | 参与讨论

阿里巴巴 | Meta-KD:跨域语言模型压缩的元知识蒸馏框架 Meta-KD: A Meta Knowledge Distillation Framework for Language Model Compression across Domains 预训练的语言模型已应用于各种NLP任务,并获得了可观的性能提升。但是,较大的模型大小以及较长的推理时间限制了此类模型在实时应用程序中的部署。典型的方法考虑知识蒸馏以将大型教师模型提炼为小型学生模型。但是,大多数这些研究仅重视单域,而忽略了来自其他域的可迁移知识。作者认为,训练具有跨域摘要的可迁移知识的教师可以实现更好的泛化能力,以帮助知识提炼。为此,作者提出了一个元知识提炼(Meta-KD)框架,以建立一个元老师模型,该模型捕获元学习启发下跨领域的可迁移知识并将其传递给学生模型。具体来说,作者首先利用跨域学习过程在多个域上训练元教师,然后提出一种元蒸馏算法,以在元教师的指导下学习单域学生模型。在两个公共多域NLP任务上进行的实验证明了所提出的Meta-KD框架的有效性和优越性。作者还演示了在短镜头和零镜头学习设置中的Meta-KD功能。 论文下载 | 参与讨论

BERT&VQA | 基于概念感知表示的视觉问答 ConceptBert: Concept-Aware Representation for Visual Question Answering 视觉问答(VQA)是一个极具挑战的任务,近年来得到了CV和NLP研究人员的广泛关注。大多数VQA基准测试都是使用单词嵌入和循环神经网络去抽取问题的语义特征,同时使用目标检测工具获取图片表示,再将图片和文本表示进行融合去训练一个VQA模型。然而,这些方法仅仅根据视觉内容来回答问题,并没有使用到外部的知识。如果引入外部知识,则可以改善图像中检测到的对象之间或者问题中的实体与图像中对象之间的关系表示。因此,作者提出了名为ConceptBert的算法用于在VQA中引入外部知识。整体框架如图所示。 论文下载 | 参与讨论 

德国锡根大学 | 反转梯度:联合学习中隐私特征被攻击的可能性 Inverting Gradients - How easy is it to break privacy in federated learning? 文章针对目前深度学习模型在训练过程中参数包含隐私信息的问题进行了一系列研究,证明了联合学习中隐私被攻击的可能性。文章首先使用了联合学习的方法训练神经网络,该方法的思想是在服务器上协同训练神经网络,每个网络分部接收网络的当前权重,然后再根据本地数据发送参数,更新权重,这样可以将输入参数保留在本地设备中,只共享参数梯度。但是即便如此,网络中的参数隐私依旧有被攻击的可能性,所以文章给出了一种基于梯度余弦相似性的参数隐私攻击,对目前常见的神经网络训练进行实验,发现从图像的参数梯度向量中重建高分辨率图像具有一定的可能性,此外还证明了训练完成的深层网络依旧可以重建原始图像。 论文下载 | 参与讨论

华盛顿大学 | 基于主动学习的稀疏半监督动作识别 Sparse Semi-Supervised Action Recognition with Active Learning  目前,最先进的基于骨架的动作识别方法大多都是有监督方法,严重依赖于标签。这类方法的性能在很大程度上受限于繁琐的标注过程和错误的标注数据。现在,一些研究者将无监督方法引入了该领域,但是现有的无监督方法需要将序列组织到聚类簇中,并且仍然需要通过标签将聚类簇与动作关联起来。在本文中,作者提出了一种新的基于骨架的动作识别方法「SESAR」,它将这些方法结合了起来。SESAR利用未标记数据和主动选择标记的少量序列信息,将无监督训练和稀疏监督指导相结合。 论文下载 | 参与讨论 

观点

颜宁评AlphaFold:算突破,但不够震撼,分子动力学模拟才是关键 颜宁教授认为:这次新闻的亮点有两个,一是AI,二是准确度高。这确实是突破,但是有了两年前的新闻做铺垫,现在这次委实是意料之中。带给我的震撼还赶不上冷冻电镜的革命。结构生物学的本质不是解结构,是理解生命、回答问题,做出生物学发现。获得结构只是手段。这里说的“发现”,特指超乎想象的通过结构才揭示出来的自然界里神奇的存在或者令人叹为观止的机理,而颜教授讲课最喜欢举的例子之一就是施一公组的剪接体结构。为啥呢?因为集合了结构生物学发现里几乎所有的精彩要素和挑战。 查看详情

行业与政策 张亚勤挂帅清华大学智能产业研究院,与智源研究院达成战略合作  12月1日,清华大学智能产业研究院(Institute for AI Industry Research, Tsinghua University,英文简称AIR)正式宣告成立,面向第四次工业革命,利用人工智能技术在智慧交通(AI+Transportation)、智慧物联(AI+IoT)、智慧医疗(AI+Healthcare)领域开展应用研究,赋能产业升级、推动社会进步。AIR由世界级科学家和企业家张亚勤博士筹建,创始团队包括前字节跳动副总裁兼AI实验室负责人马维英博士,前海尔家电首席技术官兼副总裁赵峰博士。源码资本投资合伙人、前金山集团CEO张宏江博士,英国皇家学会、英国皇家工程院院士Andrew Blake教授,澳大利亚科学院院士陶大程教授亦为AIR保驾护航,担任卓越访问教授。 查看详情 

2020年最值得关注的10家国外AI芯片初创公司 外媒CRN的作者Dylan Martin盘点了2020年迄今为止最酷的10家AI芯片初创公司,根据这些公司最近取得的成就,比如融资、新产品发布或产品性能。十家公司包括:Blaize、Cerebras、FlexLogix、Graphcore、Hailo、Kneron、LeepMind、SambaNova、SiMa.ai、Tenstorrent。 查看详情

人物

2020年度吴文俊人工智能科学技术奖获奖名单出炉  近日,2020年度第十届吴文俊人工智能科学技术奖获奖名单在其官网公示,拟对101个成果授奖,其中包括吴文俊人工智能最高成就奖1项,吴文俊人工智能杰出贡献奖3项,吴文俊人工智能自然科学奖20项,吴文俊人工智能技术发明奖8项,吴文俊人工智能科技进步奖25项、吴文俊人工智能科技进步奖企业技术创新工程项目17项,吴文俊人工智能科技进步奖科普项目3项、吴文俊人工智能优秀青年奖16项、吴文俊人工智能专项奖芯片项目8项。其中吴文俊人工智能最高成就奖由李德毅(军事科学院系统工程研究院)院士获得;吴文俊人工智能杰出贡献奖由周伯文(北京京东世纪贸易有限公司)、蒋田仔(中国科学院自动化研究所)、焦李成(西安电子科技大学智能感知与图像理解教育部重点实验室)三人分别获得。 查看详情 

数据 哈工大SCIR | 事件间因果关系方向数据调研 本文介绍事件间因果关系方向数据,此类任务通过关注两个实体间的语义关系,可以得到包含语义关系的实体关系三元组。事件间因果关系语料通常作为因果事件抽取、因果推断等任务的基础,允许使用规则、机器学习、深度学习等方法对事件链进行分析。 查看详情 

代码

R3Det:旋转目标检测网络  旋转目标检测是一项有挑战性的任务,因为难以定位多角度物体并且与背景准确和快速的分离。虽然已经取得了长足的进步,但在实际设置中,对于大宽高比,密集分布和类别不平衡的旋转目标检测仍然存在困难。在这篇论文中,提出了一种快速,准确且端到端的的旋转目标检测器。考虑到现有精炼单级检测器的特征未对齐的缺点,这篇论文设计了一个特征精炼模块来获取更准确的特征以提高旋转目标检测性能。特征精炼模块的关键思想是通过特征插值将当前精炼的边界框位置信息重新编码为对应的特征点,以实现特征重构和对齐。 查看详情 

 

统一视觉和语言BERT 如今,对于计算机视觉和自然语言处理领域的诸多人物来说,使用大规模预训练并针对特定任务进行调优成为了一种「标准」方法。最近,研究者们提出了多种方法来预训练视觉和语言 BERT,从而应对这两个人工智能的关键研究领域的交叉性挑战。通常而言,这些模型可以被分为单流或双流编码器。在本文中,作者研究了这两个研究领域之间的差异,并说明了如何在同一个理论框架下将二者统一。作者进行了对照实验,从而识别出五种「视觉-语言」BERT 之间的实证差异。实验结果表明,训练数据和超参数是造成这些差异最主要的原因,嵌入层在这些大型模型中起着至关重要的作用 查看详情 

 

LF-Font:具有局部风格表示和分解的Few-shot字体生成 由于手动设计价格昂贵,且对设计师的专业技能敏感,因此自动生成几幅字体的需求很高。现有的few-shot字体生成方法旨在学习从一些参考字形中解开样式和内容元素,并且主要集中于每种字体样式的通用样式表示。但是,这种方法限制了该模型代表各种本地风格的模型,因此使其不适用于最复杂的字母系统,例如中文,其字符由数量众多且结构复杂的组件(通常称为“激进的”)组成。在本文中,我们提出了一种通过学习局部风格(而不是通用风格)的局部样式(即逐组件风格表示)来提出一种新颖的字体生成方法。所提出的样式表示使我们能够在文本设计中综合复杂的局部细节。但是,当目标脚本具有大量的组件(例如,中文超过200个)时,仅在很少的字体生成情况下仅从参考字形中学习基于组件的样式是不可行的。为了减少参考字形的数量,我们在低秩矩阵分解的启发下,通过乘积因子和样式因子的乘积来简化逐组分样式。得益于强大的表示能力和紧凑的分解策略,我们的方法在不使用强大的局部性监督的情况下,与其他最新技术相比,显示出了很少的字体生成结果(仅包含8个参考字形图像)明显更好。每个组件,骨骼或笔触的位置。 查看详情 

教程

清华大学最新《机器学习的视觉分析技术》综述论文 机器学习的视觉分析最近已经发展成为可视化领域中最令人兴奋的领域之一。为了更好地确定哪些研究课题是有前景的,并学习如何在视觉分析中应用相关技术,我们系统地回顾了近十年来发表的259篇论文以及2010年之前的代表性作品。作者构建一个分类法,其中包括三个第一级类别:构建模型之前的技术、构建建模期间的技术和构建模型之后的技术。每个类别的进一步特征是具有代表性的分析任务,每个任务都以一组最近有影响的著作为例。作者也讨论并强调研究的挑战和对视觉分析研究人员有用的潜在未来研究机会。 查看详情 

主动学习方法入门 主动学习作为机器学习的一个子领域,旨在以尽可能少的标注样本达到模型的目标性能,广泛应用于实际需求中。本文的定位是主动学习方法的入门篇,主要介绍的内容包括:1)详细地介绍主动学习的基础知识;2)简要地介绍主动学习在学术界的研究现状;3)主动学习实践部分将简单介绍几个图像分类的案例;4)文末将给出本文的参考文献和相关资料。 查看详情 

综述:视频描述的最新方法和挑战 视频描述涉及视频中动作,事件和对象的自然语言描述的生成。通过填补视力障碍者的语言和视觉之间的空白,基于内容生成自动标题建议,基于内容浏览视频和基于视频的机器翻译,视频描述有各种应过去的十年来,在视频描述,评估指标和数据集的方法/方法方面,该领域已经完成了多项工作。为了分析视频描述任务的进度,需要进行全面的调查,涵盖视频描述方法的所有阶段,并特别关注最新的深度学习方法。在这项工作中,作者报告了有关视频描述方法各个阶段,视频描述数据集,评估指标,公开竞赛以激发对视频描述的研究,该领域的开放挑战以及未来研究方向的全面调查。在本次调查中,作者介绍了针对每个数据集提出的最新方法及其优缺点。对于这个研究领域的发展,众多基准数据集的可用性是基本需求。此外,作者将所有数据集分为两类:开放域数据集和特定于域的数据集。从作者的调查中,作者发现由于视频描述的任务属于计算机视觉和自然语言处理的交集,因此该领域的工作正在快速发展。但是,由于各种挑战,例如由于影响视觉特征质量的相似帧导致的冗余,包含更多内容的数据集的可用性以及有效评估指标的可用性等各种挑战,视频描述中的工作还远远没有达到饱和阶段。 查看详情   新工具

腾讯开源TLeague框架,基于竞争博弈的分布式多智能体强化学习框架  基于竞争性自学(CSP)的多智能体强化学习(MARL)最近表现出了出惊人的突破。包括Dota2、《王者荣耀》《雷神之锤III》《星际争霸II》等。尽管取得了成功,但MARL训练特别需要数据,在训练过程中通常需要从环境中看到数十亿个帧,这给研究人员、工程师带来了不小的困难。为了解决这个问题,腾讯团队开发了TLeague的框架,其旨在进行大规模训练并实现几种主流的CSP-MARL算法。训练可在单台机器上或混合机器(CPU和GPU)环境集群中部署,在进行分布式训练时,TLeague可以实现高吞吐量和合理的放大。由于采用了模块化设计,因此也很容易扩展,其可以解决其他多智能体问题或实现和验证MARL算法。 查看详情

法国AI实验室RTE | 面向人类网格运营商的AI助手  目前,电力系统在数字时代越来越复杂,更多的信息、不确定性、应用程序以及协调问题,对操作员带来巨大挑战,针对于以上问题,本文介绍了利用人机交互和人工智能的最新发展,分享了依赖于虚拟化界面和更多双向交互的新助手框架的愿景。在本文中,作者团队基于人机交互设计(HCID),人工智能和决策科学的最新发展,为控制室操作员介绍了一种注入AI的助手。 他们首先回顾人类和人工智能在决策中的有效性和局限性,强调它们的互补性,进一步定义一个助手。 然后,团队讨论针对电网运营商的助手的特殊性。最后,他们为研究人员如何开发和测试这种助手制定了指南。 查看详情 

应用

生物界地震,AlphaFold精确地基于氨基酸序列,预测蛋白质的3D结构 2020年11月30日,DeepMind官网宣布,其新一代AlphaFold人工智能系统,在国际蛋白质结构预测竞赛(CASP 14)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。据其官网博客显示,AlphaFold 2 对所有蛋白靶点3D结构预测的中位GDT评分为92.4分;即便是针对最难解析的蛋白靶点,AlphaFold的中位GDT评分也达到了87.0分。在接受检验的近100个蛋白靶点中,AlphaFold对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。“在有些情况下,已经无法区分两者之间的区别是由于AlphaFold的预测出现错误,还是实验手段产生的假象。”对这一结果,《Nature》直接发文称:It will change everything。由此可见一斑。 查看详情 

谷歌「气球互联网」新进展:用AI控制气球导航 这是Google「气球互联网」项目“Project Loon”交回的最新成绩单。Google母公司Alphabet于2013年6月正式启动Project Loon计划,该计划旨在将AI技术与超压气球相结合,为更多地区提供低廉且高速的无线互联网服务,尤其是与市中心相距甚远的偏远地区。前段时间,Loon顺利完成了最新一轮飞行测试。昨日,最新分析结果显示,在飞跃太平洋的39天里,Loon气球表现出了比以往更好的性能——基于最新人工智能系统,它能够更快地计算出气球的最佳导航路径;在目标区域上飞行的时间更长,消耗的能量更少,更关键的是,它还提出了研究团队此前未曾想到过的新的导航动作。而这一最新人工智能系统正是基于强化学习算法的AI系统。研究人员称,这是他们首次将RL系统应用到航空航天产品中。Loon取得的成绩,表明RL可以作为解决现实世界自主控制问题的有效解决方案。目前,有关这项研究发现的论文成果已经登上了《Nature》杂志。 查看详情 

AI仿生“电子鼻”30秒识别食品新鲜度 新加坡南洋理工大学(NTU)的研究人员通过模仿哺乳动物的嗅觉系统,发明了人工“电子鼻”,可准确评估肉类的新鲜度。实验数据显示,“电子鼻”检测准确率高达至98.5%,而传统检测方法只有61.7%。该研究成果由 NTU 联合中国江南大学以及澳大利亚莫纳什大学共同完成,并于10月发表在科学杂志《先进材料》上。 查看详情 

会议

AAAI 2021放榜:两阶段审稿录取一千六  近日,人工智能顶会AAAI 2021已经开奖,共有1692篇论文被接收,录取率21%,比去年的20.6%稍微有些上升。单从数量上看,也比去年多了101篇。本届AAAI采用两轮审稿政策,共收到9034篇投稿。两轮审稿政策对应两类文章,第一类是非NeurIPS和EMNLP转投论文;第二类是NeurIPS和EMNLP转投论文。第二类论文中,经过修改后的重投论文,如果是来自NeurIPS,且总分数高于4.9;如果是EMNLP,且总分数高于2.8的话。那么可以直接进入到AAAI 2021审稿的第二阶段。在第一阶段,每篇论文将分配两名审稿人。如果这两个审稿人认为该论文无法被录用,那么该论文将直接被拒绝。没有被拒的论文将进入第二阶段。在第二阶段中,每篇论文将另外分配两个审稿人。新的审稿人给出意见之前,他们是无法看到第一阶段的评论,也就是审稿相互独立。 查看详情 

以上是《智源社区AI周刊》第50期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,欢迎评论区留言告诉我们,谢谢大家~

内容中包含的图片若涉及版权问题,请及时与我们联系删除