导读

为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第51期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

过去一周(2020/12/07~2020/12/13),值得关注的内容有以下3方面:

  1. 近日,NeurIPS公布了今年的三篇最佳论文,他们分别是来自米兰理工大学的《No-Regret Learning Dynamics for Extensive-Form Correlated Equilibrium》、UC伯克利的《Improved Guarantees and a Multiple-Descent Curve for Column Subset Selection and the Nyström Method》和OpenAI的《Language Models are Few-Shot Learners》,即已经具有较大影响力的GPT-3,前两篇发表于Learning Theory track,而最后一篇发表于Language/Audio Applications track。(详情参见本周报“会议”栏目)

  2. 12月8日,清华计图(Jittor)发布1.2.2版本,推出了JRender 可微渲染库,并支持Vision Transformer。继10月10日发布实例分割模型库和3D点云模型库之后,计图正式发布Jittor的可微渲染库。目前支持obj加载和保存,三角网格模型渲染,内置2种主流可微渲染器,支持多种材质渲染,渲染相比PyTorch提速1.49倍~13.04倍。(详情参见本周报“新工具”栏目)

  3. 近日,由清华大学人工智能研究院、北京智源人工智能研究院、清华—中国工程院知识智能联合研究中心共同编写的《人工智能之数据挖掘》报告正式发布。报告针对数据挖掘的情况进行了深度剖析,从数据挖掘的概念内涵、关键技术、人才研究、应用场景、发展趋势5个部分,介绍数据挖掘的最近研究进展,并展望了数据挖掘的未来发展趋势。(详情参见本周报“行业与政策”栏目)

下面是各个要点的详情介绍:

论文推荐

图神经网络 | 异构图神经网络融合多源知识生成情感会话 Infusing Multi-Source Knowledge with Heterogeneous Graph Neural Network for Emotional Conversation Generation 情感对话系统的成功取决于对情感的充分理解和适当表达。在现实世界中的对话中,我们首先是本能地从多种来源的信息中感知情感,包括对话历史,面部表情和说话人的个性的情感流,然后根据我们的个性表达适当的情感,但是这些多种类型的信息在情感对话领域没有得到充分利用。为了解决这个问题,作者提出了一种基于异构图的情感对话生成模型。具体而言,作者设计了一种基于异质图的编码器,以使用异质图神经网络表示对话内容(即对话历史,其情感流,面部表情和说话人的个性),然后预测合适的情感进行反馈。之后,作者采用情绪个性识别解码器,不仅生成与对话上下文相关的响应,而且还以适当的情感生成响应,方法是将编码的图形表示,编码器的预测情感和当前说话者的个性作为输入。实验结果表明,本文的模型可以有效地从多来源的知识中感知情绪并产生令人满意的响应,这大大优于以前的最新模型。 论文下载 | 参与讨论

香港科技大学 | 跨领域命名实体识别评估 CrossNER: Evaluating Cross-Domain Named Entity Recognition 跨域命名实体识别模型能够解决目标域内命名实体样本的稀缺性问题。然而,当前大多数现有的NER基准测试缺乏领域专用的实体类型,或者不关注某个领域,从而导致跨领域评估的效率较低。为了解决这些障碍,文章引入了一个跨域NER数据集(CrossNER),它是一个全标记的NER数据集合,跨越五个不同的域,具有针对不同域的专门实体类别。然后,文章进行了全面的实验来探讨利用不同层次的领域语料库和预训练策略对跨领域任务进行领域自适应预训练的有效性。 论文下载 | 参与讨论

中科院 | 基于弱监督学习的利用新闻、出版商和用户可信度的假新闻早期检测 Early Detection of Fake News by Utilizing the Credibility of News, Publishers, and Users Based on Weakly Supervised Learning 虚假新闻的传播严重影响个人声誉和公众信任。近年来,虚假新闻检测引起了极大的关注,以往的研究主要集中在从新闻内容或传播路径中寻找线索。然而,在早期检测场景中,早期模型所需的功能往往不可用或不足,导致性能较差。因此,早期发现虚假新闻仍然是一项艰巨的挑战。从直觉上看,来自可信和权威的消息来源或许多信誉良好的用户共享的新闻比其他新闻更可靠。利用发布者和用户的可信度作为先验弱监督信息,可以在海量新闻中快速定位假新闻,并在传播的早期发现。基于这个动机,作者设计了一个多头部注意力网络(SMAN),主要解决两个挑战:(1)如何对异构图结构和新闻内容进行充分编码;(2)如何明确利用出版商和用户的公信力,促进虚假新闻的早期发现。 论文下载 | 参与讨论

华东师范大学 | GNN-XML:用于极端多标签文本分类的图神经网络 GNN-XML: Graph Neural Networks for Extreme Multi-label Text Classification 在本文中,作者团队提出了GNN-XML,这是一种针对XMTC问题而定制的可扩展图神经网络框架。简而言之,框架通过使用新颖的标签划分方法将大量标签划分为较少数量的簇来实现可伸缩性。通过将每个输入文档解析为关键字图,利用图同构网络(GIN)来全面探索深层语义上下文信息,并学习将输入文本匹配到一小组标签集群的可靠表示形式。 并且进一步提议使用双边平衡分支学习逐步将更多的重点放在尾标上。 论文下载 | 参与讨论

Tencent Lab | 命名实体识别中未标注实体问题的实证分析 Empirical Analysis of Unlabeled Entity Problem in Named Entity Recognition 在许多场景中,命名实体识别模型存在未标记实体问题,即句子的实体可能没有被完全标注。通过对综合数据集的实证研究,作者发现了导致性能下降的两个原因。一种是减少带标注的实体,另一种是将未标记的实体视为负面实例。第一个原因的影响小于第二个原因,可以通过采用训练前的语言模型加以缓解。二是严重误导训练模式,严重影响训练效果。基于上述观察,作者提出了一种能够消除未标记实体带来的误导的通用方法。其核心思想是使用负抽样来保持训练未标记实体的概率在一个非常低的水平上。在综合数据集和真实数据集上的实验表明,该模型对未标记实体问题具有较强的鲁棒性,且优于先验基线。在注释良好的数据集上,本文的模型与最先进的方法是SOTA的。 论文下载 | 参与讨论

观点

Nature:AI的瓶颈突破在于”实体人工智能(PAI)” 过去几十年里,基于数据的数字人工智能迅猛发展,计算、算法和认知的学习能力都增长显著,而机器人的机体、形态和材料发展却相对落后很多。瑞士联邦理工学院材料科学与技术实验室Aslan Miriyev和伦敦帝国理工学院Mirko Kovač教授近日在Nature Machine Intelligence上发表了一篇评论文章“Skills for physical artificial intelligence”,不仅定义了实体人工智能(physical artificial intelligence,PAI),还提议建立一套激励实体人工智能跨学科研究的技能培训体系,强调教育下一代PAI研究者的重要性。 机器之能 | 参与讨论

行业与政策 《2020升级版:人工智能之数据挖掘》发布 近日,由清华大学人工智能研究院、北京智源人工智能研究院、清华—中国工程院知识智能联合研究中心共同编写的《人工智能之数据挖掘》报告正式发布。报告针对数据挖掘的情况进行了深度剖析,从数据挖掘的概念内涵、关键技术、人才研究、应用场景、发展趋势5个部分,介绍数据挖掘的最近研究进展,并展望了数据挖掘的未来发展趋势。 学术头条 | 参与讨论

《中国营运车辆智能化运用发展报告(2020)》正式发布 2020年12月11日,国内首部营运货车智能化发展的政策性报告《中国营运车辆智能化运用发展报告 (2020)》正式发布。《报告》由国家交通运输部运输服务司指导审查,交通运输部公路科学研究院、中国智能交通产业联盟等权威机构主编,聚集来自清华大学、北汽福田、一汽解放、图森未来、智加科技等众多交通运输领域的专家,系统阐述了营运车辆智能化理论体系及落地实施指南。 智车科技 | 参与讨论

Tom Siebel创办的AI公司C3.ai上市,市值翻番达到87亿美元 Tom Siebel是软件行业的名人,1993年创办了同名公司,2005年被Oracle以58亿美元收购。C3.ai 2009年成立,最开始方向是能源管理企业软件。后来转向企业AI软件平台和相关软件,包括能源管理、预测性维护、欺诈检测、反洗钱、库存优化和预测性CRM等。 Yahoo | 参与讨论

人物

《MIT科技评论》“35岁以下科技创新35人”榜单出炉,AI领域5人入选 近日,《麻省理工科技评论》2020年中国区“35岁以下科技创新35人”榜单出炉。其中,AI领域相关人物共有5人入选,分别是:清华大学眭亚楠、清华大学赵慧婵、山东大学聂礼强、京东易津锋、西安交通大学沈超。 查看详情 | 参与讨论

Judea Pearl之后,Michael Jordan获2021年Grenander奖 美国数学会最新消息:2021年格林纳德随机理论与建模奖授予著名的“机器学习之父”Michael I. Jordan,以表彰他对机器学习所做出的奠基性贡献,尤其体现在无监督学习、概率计算,以及用计算平衡统计保真度的核心理论。格林纳德随机理论与建模奖(The Ulf Grenander Prize in Stochastic Theory and Modeling)由Grenander的同事于2016年设立。Grenander在随机过程、抽象推理和模式理论等方面具有重要影响力。该奖项每三年颁发一次,旨在表彰对随机理论和建模领域的理论与应用做出杰出贡献的学者。表彰的研究领域涵盖概率建模、统计推断或相关计算算法,尤其是对复杂或高维系统的分析。首位获奖者是2011年图灵奖得主Judea Pearl。 查看详情 | 参与讨论

数据

沃尔沃发布Cirrus:用于自动驾驶的远程双模式LiDAR数据集 在本文中,我们介绍了Cirrus,这是一种新的远程双模式LiDAR公共数据集,用于自动驾驶任务,例如3D对象检测,对高速公路驾驶和及时决策至关重要。我们的平台配备了高分辨率摄像机和一对有效距离为250米的LiDAR传感器,比现有的公共数据集长得多。我们使用高斯和均匀扫描模式同时记录配对的点云。点密度在如此长的范围内变化很大,并且不同的扫描模式进一步使LiDAR中的对象表示多样化。在Cirrus中,在整个有效范围内,在LiDAR点云中详尽注释了八类对象。为了说明此新数据集支持的研究类型,我们介绍了跨不同范围,扫描模式和传感器设备的LiDAR模型自适应。有希望的结果表明,该新数据集对机器人技术和计算机视觉社区具有巨大的潜力。 沃尔沃 | 参与讨论

代码

将BERT应用到神经机器翻译中 最近提出的BERT在自然语言理解任务(如文本分类、阅读理解等)的多样性方面显示出了强大的能力。然而,如何有效地将BERT应用到神经机器翻译(NMT)中,还缺乏足够的探索。虽然在下游的语言理解任务中,BERT更常用作微调而不是上下文嵌入,但在NMT中,作者对使用BERT作为文本嵌入的初步探索要好于使用BERT进行微调。这促使作者思考如何在这个方向上更好地利用BERT来实现NMT。提出了一种新的BERT-fused模型算法,该算法首先利用贝特提取输入序列的表示,然后通过注意机制将这些表示与NMT模型的编码器和译码器的每一层融合。作者在监督(包括句子级和文档级翻译)、半监督和无监督机器翻译上进行实验,并在七个基准数据集上获得最好的结果。 中国科学技术大学 | 参与讨论

LEAStereo:用于深度立体匹配的神经网络架构搜索 为了减少人工在神经网络设计中的工作,神经网络架构搜索(NAS)已成功地应用于各种高级视觉任务,例如分类和语义分割。NAS算法的基本思想很简单,即,为了使网络能够在一组操作(例如,具有不同过滤器大小的卷积)之间进行选择,人们便能够找到更适合该问题的最佳架构。在眼前。但是,到目前为止,NAS的成功还没有通过诸如立体匹配之类的low-level几何视觉任务获得。这部分是由于以下事实:由人类设计的最先进的深度立体匹配网络已经具有庞大的规模。基于当前可用的主流计算资源,将NAS直接应用于如此庞大的结构在计算上是令人望而却步的。在本文中,我们通过将特定于任务的人类知识整合到神经体系结构搜索框架中,提出了第一个用于深度立体匹配的端到端分层NAS框架。具体来说,遵循用于深度立体匹配的黄金标准pipeline(即特征提取-特征体积构建和密集匹配),我们共同优化了整个pipeline的架构。广泛的实验表明,我们搜索到的网络优于所有最新的深度立体匹配架构,在KITTI stereo2012、2015和Middlebury基准测试中,其准确性均名列第一;在SceneFlow数据集中,其准确性最高。网络规模和推理速度的改善。 莫纳什大学 | 参与讨论

快速精确的体素GICP三维点云配准算法 本文提出了一种体素化的广义迭代最近点(VGICP)算法,用于快速、准确地进行三维点云配准。该方法扩展了广义迭代最近点(GICP)方法的体素化,避免了代价昂贵的最近邻搜索,同时保持了算法的精度。与从点位置计算体素分布的正态分布变换(NDT)不同,我们通过聚集体素中每个点的分布来估计体素分布。体素化方法使算法能够高效地并行处理优化问题,所提出的算法在CPU上可以运行30hz,在GPU上可以运行120hz。通过在模拟环境和真实环境中的评估,我们证实了该算法的精度可以与GICP相媲美,但比现有的方法快得多。结合类ICP和NDT的两者的优点。 Github | 参与讨论

教程

NeurIPS 2020 | Google《图学习与挖掘》综述教程 在本次演讲中,Graph Mining团队的创始人Vahab Mirrokni全面介绍了Graph Mining and Learning。该Tutorial涉及图是什么,图为什么重要以及图出现在大数据世界中什么地方。该Tutorial深入探讨构成“图挖掘和学习”的核心工具,并列出几个规范的例子。它还讨论了如何在不同的分布式环境中结合算法,系统和机器学习以构建可扩展的图学习系统。最后,它提供了Google图挖掘和学习项目的历史记录。 Google | 参与讨论

Google | 关于X-former模型综述 Efficient Transformers: A Survey 在NLP领域transformer已经是成功地取代了RNN(LSTM/GRU),在CV领域也出现了应用,比如目标检测和图像加注,还有RL领域。本文主要介绍的是一篇谷歌在arXiv发表的综述论文“Efficient Transformers: A Survey“。文章主要针对一类X-former模型,例如Reformer, Linformer, Performer, Longformer为例,其对原版Transformer做了改进,提高了其计算和内存的效率。 知乎 | 参与讨论

UC伯克利马毅新书预印版开放下载,探讨低维模型与高维数据分析 近日,加州大学伯克利分校电气工程与计算机科学系教授马毅(Yi Ma)宣布其与哥伦比亚大学电气工程系副教授John Wright合著的新书《High-Dimensional Data Analysis with Low-Dimensional Models: Principles, Computation, and Applications》开放了 pre-production 版本。本书涵盖了用于高维数据分析的新的数学原理(统计学与几何学)、可扩展(凸与非凸)优化方法以及一些重要的应用(例如科学成像、宽带通信、人脸识别、3D 视觉和深度网络等)。本书将用作数据科学、信号处理、优化和机器学习领域的入门级研究生教材,它已经被用于EECS 290(加州大学伯克利分校)和ELEN 6886(哥伦比亚大学)两门课程。 UC伯克利 | 参与讨论

新工具

清华计图新版本发布:支持热门的可微渲染,多项CV任务速度超越PyTorch 12月8日,清华计图(Jittor)发布1.2.2版本,推出了JRender 可微渲染库,并支持Vision Transformer。继10月10日发布实例分割模型库和3D点云模型库之后,计图正式发布Jittor的可微渲染库。目前支持obj加载和保存,三角网格模型渲染,内置2种主流可微渲染器,支持多种材质渲染,渲染相比PyTorch提速1.49倍~13.04倍。 Jittor | 参与讨论

斯坦福Silvio/李飞飞组开源大型室内场景的模拟环境iGibson 近日,斯坦福视觉与学习实验室(SVL)Silvio / 李飞飞组的研究者推出了一个全新的模拟环境iGibson,从而可以为大型真实场景中的交互任务开发机器人解决方案。iGibson已经开源,包含15个充分可交互、视觉上逼真、依据真实房屋构建的场景,并且可以支持CubiCasa5K和3D-Front的8000余个场景。真正实现了「可交互性」。 斯坦福大学 | 参与讨论

阿里开源面向NLP的深度学习框架EasyTransfer 在《EasyTransfer -- A Simple and Scalable Deep Transfer Learning Platform for NLP Applications》这篇论文中,来自阿里巴巴的研究者开发了一个新的深度迁移学习框架 EasyTransfer,并向开源社区开放。该框架支持多种自然语言处理(NLP)任务中使用的各类 TL 算法,为真实应用中的模型训练、推理和部署提供了统一的 pipeline。目前,该框架已经整合入阿里巴巴的很多深度学习产品中,并实现了显著的性能增益。 阿里巴巴 | 参与讨论

应用

Nature子刊:人工智能预测更好的抗癌药物组合 2020年12月1日,芬兰阿尔托大学、赫尔辛基大学和图尔库大学的研究人员在 Nature Communications 杂志上发表题为:Leveraging multi-way interactions for systematic prediction of pre-clinical drug combination effects 的研究论文。在这项研究中,研究团队开发了一种人工智能算法——comboFM,它可以精确预测不同抗癌药物的组合是否可以对癌细胞形成联合杀伤作用。这一新的人工智能模型是用从以前研究中获得的大量数据进行训练的,据称为系统预筛选药物组合提供了十分高效的手段。 学术头条 | 参与讨论

MIT用AI自动设计机器人形态 近日,来自麻省理工学院(MIT)的研究人员,成功开发了一种计算机系统,研究人员利用该系统可以对机器人的形状进行仿真,并确定哪种设计的效果是最优的。相关论文以“RoboGrammar: Graph Grammar for Terrain-Optimized Robot Design”为题,发表在2020年度SIGGRAPH亚洲的会议上。哥伦比亚大学的机械工程师兼计算机科学家Hod Lipson评价道:“这项工作是25年来自动设计机器人形态和控制的最高成就。使用形状语法的想法已经存在了一段时间了,但是没有一个地方像在这部作品中那样完美地实现了这个想法。一旦我们能够让机器自动设计、制造和编程机器人,所有的赌注都将消失。” 学术头条 | 参与讨论

会议

NeurIPS 2020最佳论文公布:OpenAI、米兰理工大学、UC伯克利获奖 近日,NeurIPS公布了今年的三篇最佳论文,他们分别是来自米兰理工大学的《No-Regret Learning Dynamics for Extensive-Form Correlated Equilibrium》、UC伯克利的《Improved Guarantees and a Multiple-Descent Curve for Column Subset Selection and the Nyström Method》和OpenAI的《Language Models are Few-Shot Learners》,即已经具有较大影响力的GPT-3,前两篇发表于Learning Theory track,而最后一篇发表于Language/Audio Applications track。 参与讨论

以上是《智源社区AI周刊》第51期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,欢迎评论区留言,谢谢大家!

内容中包含的图片若涉及版权问题,请及时与我们联系删除