导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第43期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况),数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

在过去一周(2020/10/12~2020/10/18)左右时间,首先值得推荐的内容有以下3方面:

  1. 10月14日,清华团队再发突破性新成果——首次提出“类脑计算完备性”以及软硬件去耦合的类脑计算系统层次结构。相关论文《一种类脑计算系统层次结构》发表于《自然》10月第三期 。 论文的共同第一作者为清华大学研究员、智源研究员张悠慧,博士后渠鹏,博士生季宇,精仪系博士生张伟豪;共同通讯作者为张悠慧与施路平教授;其他合作者包括清华大学教授、智源研究员陈文光,清华大学研究员、智源研究员宋森,以及智源青年科学家李国齐等多位智源学者 。 (详情参见本周报“ 论文推荐 ”栏目)
  2. 第28届ACM国际多媒体会议(ACM MM)最佳论文奖、最佳学生论文奖、最佳demo奖、最佳开源软件奖在内的所有多媒体领域大奖都已出炉。其中最佳论文的一作是来自南开大学 Hongru Liang,最佳学生论文的一作是来自西安交大的 Wenbo Zheng 。 (详情参见本周报“ 会议 ”栏目)
  3. “CCF-ACM人工智能奖”授予在人工智能理论、技术或应用做出杰出贡献,且获奖时在中国工作的专业人士。该奖由CCF和ACM共同评选和颁发,于2020年设立。CCF奖励委员会决定授予南京大学周志华教授2020年“CCF-ACM人工智能奖”,以表彰他在机器学习的多个领域做出的杰出贡献。 (详情参见本周报“ 人物 ”栏目)

下面是各个要点的详情介绍。

论文推荐 基于预训练语言模型的多语言事实知识检索 Multilingual Factual Knowledge Retrieval from Pretrained Language Models

目前,语言模型通过完成完形填空风格的空白问题,成功地捕获了事实知识。但是,尽管知识是用多种语言编写和查询的,但关于LM的事实表示能力的研究几乎总是以英语进行的。为了评估LM中不同语言的事实知识检索,作者为类型多样的语言创建了完形填空样式的多语言基准。为了正确处理语言变化,作者将探测方法从单字实体扩展到多字实体,并开发了几种解码算法以生成多令牌预测。广泛的实验结果提供了有关当前最新的LM在使用或多或少可用资源的语言中执行此任务的性能(或较差)的见解。作者进一步提出了 一种基于代码切换的方法,以提高多语言LM访问知识的能力,并验证其在几种基准语言上的有效性。 论文下载

仅使用标签名的文本分类:一种语言模型自训练方法 Text Classification Using Label Names Only: A Language Model Self-Training Approach

当前的文本分类方法通常需要大量带标签的数据作为训练数据,在实际应用中通常难以满足。而在实际生活中,人们可以只通过基于描述待分类类别的少量单词执行分类,而不需看到完整带标签的示例。基于这个动机,文章研究了在纯无标签数据上只提供每个类的标签名称来训练分类器的弱监督文本分类问题。作者使用经过预训练的神经语言模型,既作为用于类别理解的通用语言知识来源,又作为文档分类的表示学习模型。 论文下载

用于文本到图像多模态任务的视觉信息捕获文本表示 VICTR: Visual Information Captured Text Representation for Text-to-Image Multimodal Tasks

针对文本-图像多模态任务,本文提出了一种新的视觉上下文文本表示方法VICTR,它能从文本输入中获取对象丰富的视觉语义信息。在文本到图像的多模态任务中,基于输入文本生成图像或者检索图像是一项极具挑战的任务。因为原始输入文本描述的信息覆盖非常有限,无法完全描述视觉逼真的图像。针对这个挑战,文章提出了一种新的视觉上下文语义表示模型VICTR,该模型能够从输入文本中获取对象丰富的视觉语义信息。VICTR有5个子模块,分别是(1)文本到场景图解析,(2)场景图嵌入,(3)位置图嵌入,(4)视觉语义信息嵌入,(5)视觉上下文语义表示。模型原理如图所示。 论文下载

RANDGAN:用于COVID-19胸部X光片检测的随机化生成对抗网络 RANDGAN: RANDOMIZED GENERATIVE ADVERSARIAL NETWORK FOR DETECTION OF COVID-19 IN CHEST X-RAY

基于卷积神经网络(CNN)的有监督深度学习模型需要大量的各类带标签训练数据,才能实现精准的疾病检测,这种费时费力的数据标注过程反过来又会在疫情严重时加大医疗系统的负担。在本文中,作者提出了一种随机化的对抗生成网络(RANDGAN),能够在不需 要对新冠患者肺部X管光片进行标注的条件下,将带标签的图像(健康人、患有其它病毒性肺炎的患者)与不带标签的新冠患者的图像区分开来。具体而言,作者在本文中使用了目前最大公开COVID-19胸片数据集 COVIDx 。他们首先利用迁移学习技术将 COVIDx 数据集中图像的肺部分割出来;接着,他们说明了分割出的ROI对于提升分类性能的重要性。最后,作者将RANDGAN与传统的用于医学图像异常检测的基于对抗生成网络(GAN)的方法进行了对比。 论文下载

《自然》重磅:清华团队提出神经形态计算系统新架构 A system hierarchy for brain-inspired computing

来自清华大学、北京信息科学与技术国家研究中心、美国特拉华大学(University of Delaware)科研团队的一项突破性研究,或将加速类脑计算和通用人工智能(Artificial General Intelligence,AGI)的到来。研究人员在类脑计算通用系统层次结构方向取得突破性进展,并提出了“神经形态完备性”(neuromorphic completenes )的最新概念。 相关论文A system hierarchy for brain-inspired computing发表在《自然》(Nature)10月第三期(Volume 586 Issue 7829)上,清华大学计算机系研究员、智源学者张悠慧(第一作者)和清华大学教授、清华大学类脑计算中心主任施路平为该论文的共同通讯作者。作者里还有好几位智源学者:李国齐、陈文光和宋森老师。 论文下载

观点 加州大学伯克利分校教授 Michael Jordan:人工智能研究的目标变了,不再是构建单个智能

近期,加州大学伯克利分校的机器学习专家Michael I. Jordan在 “ 北大人工智能开学第一课 ” 中,分享了《机器学习与微观经济学的融合》。在本次演讲中,Michael Jordan提出一个新的观点,即人工智能正逐步由原理性研究走向人工智能工程。伴随这个过程,人工智能的目标也发生了本质性变化,不再只是去研究如何“在单个计算机上复现人类智能”,更重要的是如何“构建现实世界中的系统,从而解决现实世界中的超大规模问题”。 智源社区

行业与政策 Forrester机器学习报告发布,腾讯云跃居第一阵营

国际权威分析机构Forrester发布 Now Tech: Predictive Analytics And Machine Learning In China, Q3 2020 报告,该报告选取了国内市场中主流的预测分析和机器学习领域厂商进行评估 。 这份预测分析和机器学习领域报告,从市场表现角度,将受评估厂商划分为Large(大型,年收入大于2亿人民币)、Midsize(中型,年收入5000万到2亿人民币)、Small(小型,年收入小于5000万人民币)三个等级。基于人工智能领域的优势,腾讯云从2018年的第三阵营上升到第一阵营。 AI科技评论

自主可控的仿真平台是基石,或将开启自动驾驶竞争下半场

自动驾驶的发展已经进入到下半场, 但 问 自动驾驶仿真这一新生领域的发展还存在着不少挑战,行业对这一领域的探索也尚且不够。如何提升自动驾驶仿真测试平台必备的核心能力?如何开辟出更高效更经济的平台设计路线,减少重复造轮子的工作?如何打破国外自动驾驶仿真软件长期垄断现状,突围自动驾驶下半场?这些都是现阶段行业亟需思考的问题。 新智驾

罗氏达成18亿美元合作,利用人工智能设计新一代AAV载体

Dyno Therapeutics今天宣布与罗氏(Roche)达成一项合作和许可协议,将利用该公司的 CapsidMap 平台开发新一代腺相关病毒(AAV)载体,用于为罗氏和旗下Spark Therapeutics公司的研发管线开发治疗中枢神经系统(CNS)疾病的基因疗法和肝脏定向递送的疗法。 药明康德

人物 南大周志华教授获首届CCF-ACM人工智能奖

“CCF-ACM人工智能奖”授予在人工智能理论、技术或应用做出杰出贡献,且获奖时在中国工作的专业人士。该奖由CCF和ACM共同评选和颁发,于2020年设立。CCF奖励委员会决定授予南京大学周志华教授2020年“CCF-ACM人工智能奖”,以表彰他在机器学习的多个领域做出的杰出贡献。周志华,南京大学教授、计算机系主任、人工智能学院院长、欧洲科学院外籍院士、ACM/AAAS/AAAI/IEEE/IAPR Fellow、CCF会士。主要研究方向为人工智能、机器学习、数据挖掘。 AI科技评论

数据 全球最大最干净的人脸识别数据集Glint360K开源

格灵深瞳开源了全球最大最干净的人脸识别数据集Glint360K。Glint360K具有36w类别,和1700w张图片,不论在类别数还是图片数目,相比起MS1MV2都是大幅度的提升。 格灵深瞳

代码 通过不确定性理解神经生成式摘要模型

seq2seq生成式摘要模型的一个优点是它们以自由格式生成文本,但是这种灵活性使得难以解释模型行为。在这项工作中,该论文通过研究模型令牌级别的预测或熵或不确定性,以黑盒和白盒方式分析摘要解码器。对于两个摘要数据集上的两个预先训练好的强模型PEGASUS和BART,作者发现低预测熵与模型复制令牌而不是生成新颖文本之间具有很强的相关性。解码器的不确定性还与诸如句子位置和相邻令牌对之间的句法距离之类的因素有关,从而使人知道哪些因素使得上下文对于模型的下一个输出标记特别有选择性。最后,作者研究解码器不确定性与注意行为之间的关系,以了解注意力机制如何在模型中导致这些观察到的影响。作者表明不确定性是更广泛地分析摘要和文本生成模型的有用观点。 The University of Texas at Austin

PlugNet :一种基于可插拔的超分辨学习单元的文本识别方法

此前,解决模糊问题往往需要依赖于串联一个大型的超分辨网络来进行图像级的超分辨学习,以此改善输入图像的质量。这种方案往往需要依赖有力的数据集划分以及大量的计算资源,在实际应用中显得并不具有性价比。因此,作者提出了一个含有可插拔超分辨单元的端到端学习的文本识别方法( PlugNet )。通过在训练时增加超分辨支路来改善特征表达的方式提升低质量文本的识别结果,这也就意味着相对于原始的文本识别方案, PlugNet 在应用时(前向计算)没有增加任何额外的计算量。 ECCV 2020

pSp :用于图到图转换的 StyleGAN 编码器

该 pSp 框架提出一种编码器网络,可以生成一系列样式向量,这些向量被馈入预训练的 StyleGAN 生成器中,从而形成扩展的W+潜在空间。该编码器可以直接将真实图像转换到 W+中,无需进行其他优化。本文引入一种设计精巧的identity loss,能够提高图像的重建性能。 pSp 是一种简单的体系结构,通过利用训练好的的固定生成器网络,可以将其轻松应用于各种图像到图像的翻译转化任务。通过style表示来解决这些图像转换任务,可以不只依赖于局部像素间的相关性,而进一步支持多模态信息合成。 pSp 可以在没有标签数据的情况下将侧脸图像转为正脸,也可以产生多模态结果以利用骨架或者语义分割信息进行条件人脸生成。 ICLR 2020 open review

教程 机器学习实战:基于 Scikit -Learn、 Keras 和TensorFlow

这本机器学习畅销书基于TensorFlow 2和 Scikit -Learn的新版本进行了全面更新,通过具体的示例、非常少的理论和可用于生产环境的Python框架,从零帮助你直观地理解并掌握构建智能系统所需要的概念和工具。全书分为两部分。第一部分介绍机器学习基础,涵盖以下主题:什么是机器学习,它试图解决什么问题,以及系统的主要类别和基本概念;第二部分介绍神经网络和深度学习,涵盖以下主题:什么是神经网络以及它们有什么用,使用TensorFlow和 Keras 构建和训练神经网络的技术,以及如何使用强化学习构建可以通过反复试错,学习好的策略的代理程序。第一部分主要基于 Scikit -Learn,而第二部分则使用TensorFlow和 Keras 。 专知

UC伯克利 : 深度强化学习最新课程

当地时间10月11日,UC伯克利电气工程与计算机科学系(EECS)助理教授Sergey Levine在推特上宣布,他讲授的CS285深度强化学习(RL)课程已经放出了部分视频,并表示之后每周会实时更新后续课程。主题涵盖深度强化学习领域的方方面面,UC伯克利 CS 285 2020秋季课程视频放出。 UC伯克利

【ISOLABS】最新《图神经网络实用指南》

图神经网络最近在人工智能领域变得越来越受欢迎,这是因为它们具有提取相对非结构化数据类型作为输入数据的独特能力。尽管GNN体系结构的一些元素在操作上与传统神经网络 ( 以及神经网络变体 ) 的概念相似,但其他元素则不同于传统的深度学习技术。本教程通 过整理和呈现最常见类型的GNNs的动机、概念、数学和应用的详细信息,向一般深度学习爱好者展示了GNNs的强大功能和新颖之处。 ISOLABS

新工具 OpenCV发布4.5版本

OpenCV 4.5版本已于近日发布了,作为2020秋季常规版本,本次的更新内容主要如下。 1 . 从4.5版本开始,OpenCV将正式使用Apache 2授权协议,对开发者更加友好,避免专利算法进入OpenCV带来的潜在纠纷 ;2 . 因为SIFT专利到期,成为公有技术,代码被移到主库(实际上4.4版本已经进了) ;3 . OpenCV中的RANSAC 算法进行了改进,相信做过图像匹配的同学都不陌生 ;4 . 新增了实时单目标跟踪算法 SiamRPN ++ ;5 . 改进了数字识别和文本识别的例程 ; 6. 针对RISC-V指令集进行了优化 ;7 . 增加Julia语言OpenCV绑定。 OpenCV

情景智能平台:多模态一体化人工智能开源框架

如何构建能够实时感知、理解并在人类世界中行动的人工智能系统?事实上,要建立这样的系统需要组合和协调不同的人工智能技术,将多种人工智能技术(如机器学习、计算机视觉、语音识别、自然语言处理和对话管理等)结合在一起。最近,微软研究院推出的情景智能平台(Platform for Situated Intelligence)致力于提供完整的开发套件,能大大提高应用开发及相关研究的效率,或许在一定程度上推动了该问题的解决。 微软亚洲研究院

欧洲发布最强AI超级计算机LEONARDO

本周在意大利CINCA研究中心揭幕的Leonardo(莱昂纳多)超算是用了14000个Nvidia GPU,Nvidia称其为“世界上最强大的AI系统”,这个系统在某些半精度浮点(FP16)应用中提供10 exaflops的AI性能,在以Top500为基准进行测试时,可以提供大约200 petaflops算力。这一系统的推出,也将从今年底开始改变欧洲超算系统的格局。 雷锋网

应用 伯克利AI预测自动驾驶汽车何时将“脱离”

“ 脱离 ” ,在自动驾驶系统中是一个重要的指标。是指当自动驾驶汽车遇到故障,脱离自动驾驶模式,改为人类驾驶员接管车辆的情况。很多人认为 “ 脱离 ” 次数越少,就能说明一个自动驾驶系统能力越强。因此,以往的研究都会把 “ 脱离 ” 当作是故障来排除掉。但最近,UC伯克利的研究人员却 “ 以毒攻毒 ” ,直接用这样的数据来训练机器人,预测未来何时将发生脱离事件。研究人员称它为 LaND ——从 “ 脱离 ” 中学会导航。研究人员表示,通过这样的方法得到的结果,要比传统的强化学习、模仿学习都要强。 量子位

UCL & 伦敦大学学院 : 将域适应中的不确定性用于MRI前列腺病灶分割

本文被医学人工智能顶会MICCAI 2020接收。众所周知,缺乏足够的高质量标注数据极大制约着医学图像分析技术的发展。近年来,基于领域自适应的迁移学习方法受到了越来越多研究人员的关注。在本文中,来自UCL的研究人员利用领域自适应模型中的不确定性提除了一种一对多的图像转换模式,并将其成功应用于前列腺病灶分割任务。 UCL

Facebook AI联手CMU宣布Open Catalyst项目,利用AI寻找存储可再生能源的新方法

Facebook AI 和卡内基梅隆大学(CMU)化学工程系今天宣布启动Open Catalyst Project,该合作项目旨在利用AI将量子力学模拟加速1000倍,以便发现存储可再生能源所需的更高效和可扩展的新型电催化剂。 Facebook AI

会议 ACM MM 2020大奖项出炉

第28届ACM国际多媒体会议(ACM MM)最佳论文奖、最佳学生论文奖、最佳demo奖、最佳开源软件奖在内的所有多媒体领域大奖都已出炉。其中最佳论文的一作是来自南开大学 Hongru Liang,最佳学生论文的一作是来自西安交大的 Wenbo Zheng。 查看详情

以上是《智源社区AI周刊》第43期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请评论区留言。谢谢大家。

© 北京智源人工智能研究院,版权所有

内容中包含的图片若涉及版权问题,请及时与我们联系删除