导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第19期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况),数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

在过去一周(2020/04/20~2020/04/27)左右时间,首先值得推荐的内容有以下3方面:

  1. 来自南京大学的张绍群博士和周志华教授提出了一个名为Flexible Transmitter的模型,这是一种具备灵活可塑性的新型生物拟真神经元。FT模型利用一对参数来建模神经元之间的传输递质(transmitter),并设置一个神经递质调节的记忆单元来记录所关注神经元的长期学习信息。因此,该研究将FT模型形式化为一个二元二值函数,常用的MP神经元模型是其特殊形式。FT模型可以处理更加复杂的数据,甚至时序信号。(详情参见本周报“论文推荐”栏目)
  2. 近日,北京智源人工智能研究院数据开放研究中心联合清华大学、中国工程科技知识中心、清华大学附属北京长庚医院、阿里巴巴智能计算实验室、搜狗搜索、智谱.AI等单位,正式发布“知识疫图-全球新冠疫情智能驾驶舱(COVID-19 Graph - Knowledge Dashboard)”,旨在提供全面的疫情动态数据和精细的风险指数预测;以知识为核心,为用户提供疫情相关数据、新闻、学术动态,并为用户行为及决策提供参考。(详情参见本周报“新工具”栏目)
  3. 日前,谷歌量子人工智能实验室(Quantum AI Lab)关键人物约翰·马提尼斯(John Martinis)宣布辞职。马提尼斯表示:“我的职业目标是打造一台量子计算机,所以我的离职对所有人来说都是最好的选择。”(详情参见本周报“人物”栏目)

下面是各个要点的详情介绍。

论文推荐 新型神经元模型FT Flexible Transmitter Network

来自南京大学张绍群博士和周志华教授提出了一个名为Flexible Transmitter的模型,这是一种具备灵活可塑性的新型生物拟真神经元。FT模型利用一对参数来建模神经元之间的传输递质(transmitter),并设置一个神经递质调节的记忆单元来记录所关注神经元的长期学习信息。因此,该研究将FT模型形式化为一个二元二值函数,常用的MP神经元模型是其特殊形式。FT模型可以处理更加复杂的数据,甚至时序信号。为了展示FT模型的能力和潜力,研究者提出了 Flexible Transmitter Network。FTNet基于最常见的全连接前馈架构而构建,并使用FT神经元作为其基本构造块。FTNet允许梯度计算,并且可以通过在复数域中的反向传播算法来实现。在一系列任务上的实验结果展示了FTNet的优越性能。这项研究为神经网络提供了另一种基本构造块,展示了开发具有神经元可塑性的人工神经网络的可行性。 论文下载

TriggerNER:使用实体触发器学习作为解释的命名实体识别 TriggerNER: Learning with Entity Triggers as Explanations for Named Entity Recognition

本文由南加州大学和亚马逊研究部门联合发表。在新领域中为命名实体识别训练神经模型通常需要额外的人工注释,这些注释的收集通常是昂贵和耗时的。因此,一个关键的研究问题是如何以一种经济有效的方式获得监督信号。在这篇论文中,作者介绍了“实体触发器”,这是一种人类解释的有效代理,有助于NER模型的标签高效学习。实体触发器被定义为一个句子中的一组单词,这有助于解释为什么人们会识别句子中的实体。此后作者提出的触发器匹配网络模型,通过对触发器表示形式和软匹配模块的联合学习和自注意力机制,可以方便地对不可见的句子进行标记。实验表明,该框架具有更高的成本效益,使用20%的触发注释语句可以获得与使用70%训练数据的传统监督方法相当的性能。 论文下载

结构注意力的神经抽象摘要 Neural Abstractive Summarization with Structural Attention

本文由CMU发表。基于注意力的、基于RNN的编解码器体系结构在对新闻文章进行抽象摘要方面取得了令人瞩目的成绩。然而,这些方法不能解释文档句子中的长期依赖关系。这个问题在多文档摘要任务中更加严重。这些线索包含的答案往往相互重叠或相互矛盾。在这项工作中,作者提出了一种基于结构注意力建模这种句子间和文档间依赖关系的层次编码器。本文将流行的指针-生成器体系结构及其派生的一些体系结构设置为基线,并说明它们无法在多文档设置中生成良好的摘要。本文进一步证明,本文提出的模型在单文档和多文档摘要设置方面都比基线有了显著的改进——在前一种设置中,它分别比CNN和CQA数据集上的最佳基线提高了1.31和7.8个ROUGE-1点;在后一种设置中,CQA数据集的性能进一步提高了1.6个ROUGE-1点。 论文下载

前置不变表示的自监督学习 Self-Supervised Learning of Pretext-Invariant Representations

本文由Facbook AI部门发表。从图像中进行自监督学习的目标是通过不需要对大量训练图像进行语义注释的前置任务来构造语义上有意义的图像表示。许多前置任务导致与图像变换协变的表示。相反,本文作者认为语义表示在这种转换下应该是不变的。具体来说,本文提出了前置不变表示学习(PIRL),该方法学习基于前置任务的不变表示。作者将PIRL与一个常用的前置任务一起使用,该任务涉及解决拼图游戏。本文发现,PIRL极大地提高了学习图像表示的语义质量。。 论文下载

逆向工程配置的神经文本生成模型 Reverse Engineering Configurations of Neural Text Generation Models

本文由Google Research发表,试图对神经文本生成模型的基本性质有更深入的理解。对机器生成文本中由于建模选择而出现的构件的研究是一个新兴的研究领域。在此之前,这些人工制品在生成文本中出现的范围和程度还没有得到很好的研究。为了更好地理解生成文本模型及其构件,本文提出了一项新的任务,即区分给定模型的几个变体中哪个生成了一段文本,作者进行了一系列诊断测试,以观察建模选择(是否在它们生成的文本中留下可检测的构件。本文的关键发现得到了一组严格实验的支持,即存在这样的构件,并且可以通过单独观察生成的文本推断出不同的建模选择。这表明,神经文本生成器对各种建模选择的敏感度可能比之前认为的要高。。 论文下载

观点 Hinton回应“指控”:我的贡献是展示使用BP算法学习分布式表征

近日,计算机科学家、LSTM之父Jürgen Schmidhuber发文,以六条理由批评Geoffrey Hinton不应获得2019年本田奖。其中第一条理由就是“反向传播并非Hinton原创”。而Hinton表示:“我是明确表明反向传播可以学习有趣的内部表征,并使该想法推广开来的人。我通过让神经网络学习词向量表征,使之基于之前词的向量表征预测序列中的下一个词实现了这一点。” Reddit

行业与政策 发改委:新基建包括人工智能等新技术基础设施、智能计算中心、智能融合基础设施、重大科技基础设施

4月20日上午,国家发展改革委通过网上方式举行4月份新闻发布会。高技术司司长伍浩在介绍新基建时表示,目前来看,新型基础设施主要包括3个方面内容:一是信息基础设施。主要是指基于新一代信息技术演化生成的基础设施,比如,以5G、物联网、工业互联网、卫星互联网为代表的通信网络基础设施,以人工智能、云计算、区块链等为代表的新技术基础设施,以数据中心、智能计算中心为代表的算力基础设施等。二是融合基础设施。主要是指深度应用互联网、大数据、人工智能等技术,支撑传统基础设施转型升级,进而形成的融合基础设施,比如,智能交通基础设施、智慧能源基础设施等。三是创新基础设施。主要是指支撑科学研究、技术开发、产品研制的具有公益属性的基础设施,比如,重大科技基础设施、科教基础设施、产业技术创新基础设施等。 发改委

AI芯片明星创企Wave Computing申请破产保护,中国区关闭

Wave Computin在2010年成立于美国加利福尼亚,是AI芯片领域被看好的新兴公司之一,专注于通过基于数据流驱动(dataflow)技术、以及实现dataflow技术的软件可动态重构处理器(CGRA)架构,突破AI芯片性能和通用性的瓶颈,加速从数据中心到边缘的AI深度学习计算。 2018年6月,Wave Computing收购老牌半导体IP公司MIPS,计划通过将它的数据流架构与它的MIPS嵌入式RISC多线程CPU核心和IP相结合,为下一代AI提供了动力。MIPS在1999年前曾是世界上被使用最多的处理器架构,一度是与x86、Arm齐名的三大处理器架构之一,可惜在生态的较量中渐显颓势,经多次辗转卖身后,于2018年6月归于Wave Computing麾下。 该公司在2018年12月宣布完成8600万美元E轮融资,累计融资金额已超过2亿美元。但有分析认为,Wave的AI数据流处理器未见得会比英伟达或Graphcore好太多,除非Wave有很大的优势,否则难以吸引别人冒险使用其产品,以及让投资人继续注资。

凤凰网

临床研究软件工具设计公司“Unlearn.AI”获1200万美元A轮融资

为临床研究设计软件工具的初创公司“Unlearn.AI”获得了1200万美元A轮融资,此轮融资由8VC领投,现有投资者DCVC、DCVC Bio和Mubadala Capital Ventures参投。Unlearn.AI建立了一个平台,应用机器学习的方法,开发了疾病发展监测计算机模型,从而提供了一个有效解决病人之间的异质性问题的工具。

36Kr

人物 Google量子计算关键人物John Martinis宣布辞职 日前,谷歌量子人工智能实验室(Quantum AI Lab)关键人物约翰·马提尼斯(John Martinis)已宣布辞职。马提尼斯表示:“我的职业目标是打造一台量子计算机,所以我的离职对所有人来说都是最好的选择。” 谷歌发言人没有对马提尼斯的话发表评论,发言人表示公司非常感谢马提尼斯做出的贡献,哈特穆特·纳文将继续领导公司的量子计算项目。谷歌母公司Alphabet还在X Labs研究部门设置了第二个规模较小的量子计算研究小组。马提尼斯在谷歌任职期间也一直担任加州大学圣塔芭芭拉分校的教授,他表示自己将继续量子计算的研究。 机器之心

数据 FineGym:用于细粒度动作理解的分层视频数据集

在公共基准数据集上,当前的动作识别技术已经取得了巨大的成功。然而,在现实世界的应用中,例如体育分析,它需要将一项活动分解成几个阶段,并区分细微不同的动作,它们的性能仍然远远不能令人满意。为了将动作识别提升到一个新的水平,本文开发了FineGym,一个建立在体操视频之上的新数据集。与现有的动作识别数据集相比,FineGym具有丰富、优质和多样性的特点。特别是,它提供了一个三层语义层次的动作和子动作级别的临时注释。这种新的粒度级别对操作识别提出了重大挑战,例如如何从一个一致的操作解析时间结构,以及如何区分细微不同的操作类。本文系统地研究了该数据集上的代表性方法,并获得了一些有趣的发现。

香港中文大学

GLDv2:Google发布大规模实例级检索和识别基准数据集

随着图像检索和实例识别技术的迅速发展,急需有效的基准数据来对不断出现算法的性能进行有效测评。来自Google的研究人员为此设计并推出了Google Landmarks Dataset v2(GLDv2)数据集用于大规模、细粒度的地标实例识别和图像检索人物。这一数据集包含了200k个不同实例标签共5M张图像,其中包括测试集为检索人物标注的118k张图像。这一数据集的特点不仅在于规模,而且在于考虑了许多真实应用中会遇到的问题,包括长尾特性、域外图像、类内丰富多样性等特点。这一数据集除了可以作为检索和识别人物的有效基准外,研究人员还通过学习图像嵌入呈现了其用于迁移学习的潜力。

Google

FUSS:Google发布通用声音分割数据集

录音通常包含各种不同的声源。以前,声音分离工作着重于分离少量声音类型,例如“语音”与“非语音”,或相同类型声音的不同实例,例如扬声器1与扬声器2。通常在这样的工作中,还假设声音类型数量是先验的。FUSS数据集将重点转移到了一个更普遍的问题上,即将可变数量的任意声音彼此分开。 Google

代码 斯坦福大学NLP组Python深度学习自然语言处理工具Stanza使用t

Stanza是一个纯Python实现的自然语言处理工具包,这个区别于斯坦福大学自然语言处理组之前一直维护的Java实现CoreNLP等自然语言处理工具包,对于Python用户来说,就更方便调用了,并且Stanza还提供了一个Python接口可用于CoreNLP的调用 ,对于一些没有在Stanza中实现的NLP功能,可以通过这个接口调用CoreNLP作为补充。Stanza的深度学习自然语言处理模块基于PyTorch实现,用户可以基于自己标注的数据构建更准确的神经网络模型用于训练、评估和使用,当然,如果有GPU机器加持,速度可以更快。Stanza目前支持66种语言的文本分析,包括自动断句、Tokenize、词性标注和形态素分析、依存句法分析以及命名实体识别。

AINLP

基于CPU环境的分布式YOLOv3实现

针对现实生产环境中具有大量CPU资源而GPU奇缺的现状,并出于充分利用现有Kubernetes的目的,作者基于Uber的Horovod实现了分布式训练框架,并且可以部署在内部Kubernetes平台上,通过CPU scale来实现机器学习模型训练,达到在GPU不足的情况下,通过CPU scale来实现模型训练,降低模型训练时间和提高算法模型验证效率的目标。本文将主要介绍一下整体架构设计,YOLO3的分布式算法实现过程和单机版结果对比。

TensorFlow

Kaggle数据清洗指南

在拟合机器学习或统计模型之前,开发者通常需要清洗数据。用杂乱数据训练出的模型无法输出有意义的结果。为了将数据清洗简单化,本文介绍了一种新型完备分步指南,支持在Python中执行数据清洗流程。读者可以学习找出并清洗以下数据的方法: 1. 缺失数据; 2. 不规则数据(异常值); 3. 不必要数据:重复数据(repetitive data)、复制数据(duplicate data)等; 4. 不一致数据:大写、地址等; 该指南使用的数据集是Kaggle竞赛Sberbank俄罗斯房地产价值预测竞赛数据(该项目的目标是预测俄罗斯的房价波动)。本文并未使用全部数据,仅选取了其中的一部分样本。

机器之心

教程 智源青年科学家代季峰:用“数据+知识”解决图像理解的四大挑战

在本次报告中,代季峰认为数据驱动的联结主义(Connectionist AI)和知识驱动的符号主义(Symbolic AI)有望解决当今图像理解算法的四大重要挑战:类别长尾分布、未见场景泛化、实体/关系描述、复杂认知任务。需要指出的是,这个“符号主义+联结主义”理念,在2019年北京智源大会上,中科院院士张钹曾给予了非常高的评价,认为代表了未来第三代人工智能算法的主流趋势。 所以这场报告很值得我们一读:它通过图像识别领域一线实战的生动案例,有助于读者揣摩第三代AI算法落地应用的切入点。

北京智源人工智能研究院

可解释人工智能: 工业界挑战与经验教训

在本教程中,作者将概述AI中的模型解译性和可解释性、关键规则/法律以及作为AI/ML系统的一部分提供可解释性的技术/工具。然后,作者将关注可解释性技术在工业中的应用,在此作者提出了有效使用可解释性技术的实践挑战/指导方针,以及在几个网络规模的机器学习和数据挖掘应用中部署可解释模型的经验教训。作者将介绍不同公司的案例研究,涉及的应用领域包括搜索和推荐系统、销售、贷款和欺诈检测。最后,根据作者在工业界的经验,作者将确定数据挖掘/机器学习社区的开放问题和研究方向。

WWW 2020

自然语言处理中深度学习模型对抗性攻击综述

随着高计算设备的发展,深度神经网络近年来在人工智能领域得到了广泛的应用。然而,之前的研究表明,DNN在经过策略性修改的样本(称为对抗性样本)面前是脆弱的。这些样本是由一些不易察觉的扰动产生的,但可以欺骗DNN做出错误的预测。受图像DNNs中生成对抗性示例的流行启发,近年来出现了针对文本应用的攻击DNNs的研究工作。然而,现有的图像扰动方法不能直接应用于文本,因为文本数据是离散的。在这篇文章中,作者回顾了针对这一差异的研究工作,并产生了关于DNN的电子对抗实例。作者对这些作品进行了全面的收集、选择、总结、讨论和分析,涵盖了所有相关的信息,使文章自成一体。最后,在文献回顾的基础上,作者提出了进一步的讨论和建议。

TIS期刊

新工具 智源研究院发布“知识疫图-全球新冠疫情智能驾驶舱”,一键预测、跟踪和决策辅助

近日,北京智源人工智能研究院数据开放研究中心联合清华大学、中国工程科技知识中心、清华大学附属北京长庚医院、阿里巴巴智能计算实验室、搜狗搜索、智谱.AI等单位,正式发布“知识疫图-全球新冠疫情智能驾驶舱(COVID-19 Graph - Knowledge Dashboard)”,旨在提供全面的疫情动态数据和精细的风险指数预测;以知识为核心,为用户提供疫情相关数据、新闻、学术动态,并为用户行为及决策提供参考。

北京智源人工智能研究院

PyTorch 1.5上线:加入稳定C++前端,高级自动梯度API

PyTorch 1.5宣布上线,此版本主要包括几个新的API的添加和改进。新版PyTorch包括对C++前端的重大更新,用于计算机视觉模型的channels last存储格式,以及用于模型并行训练的分布式RPC框架的稳定版本。该版本还提供了针对自动求导机制中黑塞和雅可比的新API,以及受pybind启发,允许用户创建自定义C++类的一个API。另外,torch_xla已可在PyTorch 1.5版中使用,并在1.5版本中进行了测试,可提供成熟的Cloud TPU体验。 PyTorch

PyCaret:开源低代码机器学习Python库

PyCaret库支持数据科学家快速高效地执行端到端实验,与其他开源机器学习库相比,PyCaret库只需几行代码即可执行复杂的机器学习任务。该库适合有经验的数据科学家、倾向于低代码机器学习解决方案的公民数据科学家,以及编程背景较弱甚至没有的新手。 GitHub

应用 DeepMind用机器学习协助医药研发

数月以来,COVID-19病毒在全球范围内肆虐。建立在数十年来对冠状病毒家族特征的基础研究之上,科学界对最近的COVID-19病毒爆发作出了快速反应,众多前沿实验室开放共享关于病毒的基因组数据库,从而使得研究人员能够快速开展针对这种新病原体的测试。本文以DeepMind开发的AlphaFold System为引子,探讨了机器学习领域的一个专门方向,即如何利用机器学习协助药物开发。 机器之心

苏黎世大学:AI助力4D核磁共振扫描,数据处理速度提高30倍

四维(4D)核磁共振扫描(MRI)可以用来重建心血管血流随时间的变化,对于一系列心血管疾病的诊断具有重要意义。然而,这些扫描通常需要20分钟的处理时间,意味着扫描过程中无法对进一步成像评估做出决定。加速这类扫描,就能在患者接受扫描的同时完成实时评估,不仅能节省临床医师的时间,还能减少患者的不适。近日,来自苏黎世大学生物医学工程学院Valery Vishnevskiy教授的研究团队,成功开发了一种深度学习网络,可以显著加速4D flow MRI数据处理。这个深度学习模型有望让临床医师在患者接受核磁共振扫描的同时,实时观察血流变化,从而优化诊断工作流。 机器之心

Watson过敏分析工具使用AI预测过敏反应症状风险

IBM今天宣布根据IBM MarketScan数据训练的新工具,可利用AI预测过敏症状何时发作,称为Watson 的过敏反应分析(Allergy Insights with Watson),可在The Weather Channel应用程序中提前使用。除了可以预测过敏症状风险(例如,高,中,低)的15天预测和3天过敏原展望之外,Allergy Insights还可以在过敏风险发生变化时发出通知,并说明天气状况如何触发症状。它还提供了过敏原的花粉水平,管理过敏或减少接触的技巧,以及与过敏相关的新闻文章和社论内容。

VentureBeat

会议 NeurIPS 2020宣布deadline延期三周

在ICML 2020于三月底宣布审稿延期之后,人工智能顶会NeurIPS 2020官方刚刚也宣布了截止日期推迟的消息。NeurIPS 2020新的论文摘要提交截止日期为5月27日;论文提交截止日期为6月3日;作者通知日期为9月25日。

机器之心

经验 在AI领域,如何做个合格的审稿人?写review的3条建议

作者每年会固定接受CVPR/ECCV/ICCV/ICML/NIPS/AAAI/IJCAI的审稿邀请,基本上每年会写40多篇review。关于在review的过程中有什么值得注意的习惯,作者总结个人经历如下: 1. 多抱着多元开放的心态看待别人的工作,不要先入为主,直接片面地judge一个文章。 2. 如果每个reviewer都能对自身的认知有个客观的评估,很多reviewer中不一致的意见其实也是相当容易处理的。 3. 保持客观,屏蔽外界因素,不卑不亢评价工作。

知乎

以上是《智源社区AI周刊》第19期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,欢迎评论区留言。谢谢大家。

特约编辑:刘布楼 常政 刘沂喆

内容中包含的图片若涉及版权问题,请及时与我们联系删除