导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第49期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

过去一周(2020/11/23~2020/11/29),值得关注的内容有以下3方面:

  1. 在近日的智源论坛上,清华大学孙茂松教授提出了当前自然语言处理研究亟待攻破的挑战,分别是:1.形式化知识系统存在明显构成缺失;2.深层结构化语义分析存在明显性能不足;3.跨模态语言理解存在明显融通局限。(详情参见本周报“观点”栏目)
  2. 从观测数据进行因果推断是许多科学领域的核心问题。CMU的研究者最近提出了一种通用的受监督的深度学习框架,该框架通过将输入向量转换为每对输入的图像表示来推断因果关系。给定训练数据集,作者首先构建归一化的经验概率密度分布矩阵。然后,作者在NEPDF上训练卷积神经网络以预测因果关系。作者在几种不同的模拟和现实世界数据上测试了该方法,并将其与先前的因果推断方法进行了比较。正如本文所展示的,该方法是通用的,可以有效地处理非常大的数据集,并且对现有方法进行了改进”。(详情参见本周报“论文推荐”栏目)
  3. 基于三年来与成员企业的合作研究,微软亚洲研究院发布了多智能体资源优化平台“群策 MARO”,并将其开源。MARO适用于由资源供需不平衡导致的资源利用率低的问题,而这样的问题广泛存在于多+k+个行业的不同场景。如何更好地在不同参与者间以合理的成本提高资源利用率,为行业创造更大的利润空间,且为社会节省不必要的资源浪费,是MARO的使命。这其中,利用创新技术助力企业和组织在关键场景中高效配置资源、节能减排,也是微软可持续发展战略中的重要一环。(详情参见本周报“新工具”栏目)

下面是各个要点的详情介绍。

论文推荐 卡耐基梅隆大学 | 基于深层神经网络的因果推理 Causal inference using deep neural networks

从观测数据进行因果推断是许多科学领域的核心问题。在这里,作者提出了一种通用的受监督的深度学习框架,该框架通过将输入向量转换为每对输入的图像表示来推断因果关系。给定训练数据集,作者首先构建归一化的经验概率密度分布矩阵。然后,作者在NEPDF上训练卷积神经网络以预测因果关系。作者在几种不同的模拟和现实世界数据上测试了该方法,并将其与先前的因果推断方法进行了比较。正如本文所展示的,该方法是通用的,可以有效地处理非常大的数据集,并且对现有方法进行了改进。 论文下载 | 参与讨论

IBM&马里兰大学 | 基于多模态的恶意图文检测 Multimodal Learning for Hateful Memes Detection

恶意图文检测是一个典型的vision-language任务,近年来获得了大量关注。在传统多模态任务中,视觉和文本信息是语义对齐的。而恶意图文检测任务中的多模态信息是弱对齐的,甚至是不相关的,这使得模型不仅需要理解模因中的内容,还需要对多模态进行推理。为了解决恶意图文检测中图片与文本之间的语义鸿沟,作者提出了一种将图像字幕处理与模因检测过程相结合的方法。 论文下载 | 参与讨论

NER | 大规模生物医学命名实体识别 Meaningful Answer Generation of E-Commerce Question-Answering

命名实体识别是一项应用广泛的自然语言处理任务,是问答、主题建模、信息检索等领域的基础任务。在医疗领域,NER扮演着重要的角色,它从临床笔记和报告中提取有意义的块,然后将这些块反馈给下游任务,如断言状态检测、实体解析、关系提取和去识别。文章主要贡献有三点:1、提供了第一个生产级可伸缩的NER模型实现。2、提供一个最先进的NER模型,超过Stanza和SciSpaCy报告的生物医学NER基准。3、解释了Spark NLP中的NER模型实现,它是唯一可以在Spark集群中扩展的NLP库,同时支持流行的编程语言(Python、Java等)。 论文下载 | 参与讨论

悉尼大学陶大程团队 | 基于外观的动作识别最新进展 Recent Progress in Appearance-based Action Recognition

动作识别是一种识别视频中各种人类动作的任务,由于其在各种应用中的重要性受到了计算机研究人员越来越广泛的关注。近年来,基于外观的方法在精确动作识别方面取得了可喜的进展。一般来说,这些方法主要通过将各种方案应用于对时空视觉信息进行有效建模来完成动作识别任务。为了更好地理解该领域当前的研究进展,本文作者对该领域的最新成果进行了回顾。 论文下载 | 参与讨论

南京大学&字节跳动AI Lab|镜像生成式神经机器翻译 MIRROR-GENERATIVE NEURAL MACHINE TRANSLATION

训练神经机器翻译模型(NMT)需要大量的并行运算语料库,对于许多语言对来说都是稀缺的。然而,原始非平行语料库通常很容易获得。现有的方法没有充分利用非平行双语资料在训练或解码方面的潜力。在本文中,作者提出了镜像生成NMT(MGNMT),一个统一的体系结构它同时集成了源到目标的翻译模型源代码翻译模型和两种语言模型。翻译模型和语言模型共享相同的潜在语义空间,因此两种语言模型都是翻译方向可以更有效地从非并行数据中学习。另外,翻译模型和语言模型可以在解码过程中协同工作。作者的实验结果表明,所提出的MGNMT的性能在各种语言对和场景中的都优于其他类似的方法,包括资源丰富的以及资源不足的情况。 论文下载 | 参与讨论

观点 清华大学孙茂松教授:自然语言处理面临的三大真实挑战是形式化知识系统存在明显构成缺失、深层结构化语义分析存在明显性能不足和跨模态语言理解存在明显融通局限

在近日的智源论坛上,孙茂松教授说:”因此并不能一味追求大规模的趋势,而是应该多轨共同发展。”孙教授提出了当前亟待攻破的挑战,分别是:1.形式化知识系统存在明显构成缺失。例如现有的知识图谱大而不强,虽然规模大,但是实体间关系浅,缺少关于动作的三元组,及事件间的逻辑关系。称之为知识图谱“三缺其二”;2.深层结构化语义分析存在明显性能不足。解决知识图“三缺其二”问题依赖于对语言进行深层次语义分析。近年来对语义的分析取得了长足的进步,但是对深层结构化语义分析“欲行却止”;3.跨模态语言理解存在明显融通局限。目前对跨模态语言理解的研究方兴未艾,是新的重要研究前沿,但是跨模态关系因缺乏深层结构化语义分析和世界知识导致推理能力较弱,存在“形合意迷”的问题。 智源社区 | 参与讨论

行业与政策 中国首份Robotaxi乘客调研报告

近日,清华大学交通研究所联合文远知行共同发布了《中国首份Robotaxi乘客调研报告》,报告显示,未来随着自动驾驶的普及,Robotaxi所引发的蝴蝶效应更将带来更多变革:1. 从市场争夺上来看,满足1-3公里的短距离出行的需求响应型公交会成为自动驾驶Robotaxi新的机遇,这也意味着自动驾驶将与共享单车争夺市场;2. 从客户消费习惯上来看,家庭的购车意愿下降,报告显示,在拥有一辆及以上私家车的Robotaxi乘客中,有46%的受访乘客表示可能减少一辆私家车;而在没有私家车的乘客中,有43%的受访乘客表示可能不会购买私家车。3. 从未来出行体系上来看,未来的交通体系除了车辆自动驾驶化,还应包含其他体量、类型的出行工具的自动驾驶化,实现对整套基础设施、交通要素的整合。 智车科技 | 参与讨论

国际机器人顶会IROS2020上值得关注的工业研究趋势

本文重点对IROS 2020中Industry 4.0 Session的部分文章进行解读。相较于重点关注新材料的应用、末端触觉反馈中新传感器的应用、关节驱动器中新技术应用等技术专题,Industry 4.0主要聚焦于机器人在工业领域中不同实用场景中的最新应用进展。 机器之心 | 参与讨论

德勤:对话人工智能重塑人机交互白皮书

基于语音的交互逐渐成为数字时代人机交互的主流。与此同时,人工智能领域的不断创新突破成为全球技术研究的焦点。德勤调查显示,全球人工智能市场到2019年已达1.9万亿美元,预计到2025年将超过6万亿美元,2017-2025年复合增长率为30%。人工智能的快速发展为人机交互提供了理论和技术支持。因此,人工智能与人机交互相结合的对话式人工智能(CAI)降低了交互障碍,扩大了用户基础,在各个领域展示了广泛的用例和无限的商业价值。在这个临界点CAI的快速增强,德勤发布德勤会话人工智能白皮书,德勤的见解阐述CAI技术和在行业应用解决方案,并引入CAI四个愿景,设计工作的未来,重塑未来的生活,打破语言的障碍,和人类和机器连接。 专知 | 参与讨论

人物 2020戈登·贝尔奖出炉,获奖团队多人出自北大,包括智源学者王涵

近日,高性能计算领域备受瞩目的戈登·贝尔奖出炉!获得2020年ACM戈登·贝尔奖的是一支由中美科学家组成的8人团队。在这个8人组成的研究团队中,有7名都是华人。而在7名华人中,有5人都是出身北大。8名获奖者分别是:加州大学伯克利分校的贾伟乐和林霖、北京应用物理和计算数学研究所副研究员王涵(智源青年科学家)、北京大学应用物理与技术研究中心研究员陈默涵及其研究生路登辉,普林斯顿大学张林峰博士以及该校教授鄂维南、罗伯托·卡尔。 新智元 | 参与讨论

数据 TJU-DHD:用于目标检测和行人检测的多样化高分辨率数据集

对于自动驾驶汽车和视频监控的感知模块而言,车辆,行人和骑行者是最重要和最有趣的对象。但是,检测此类重要物体(尤其是小物体)的最新性能远远不能满足实际系统的需求。大规模,丰富多样和高分辨率的数据集在开发更好的对象检测方法以满足需求方面起着重要作用。从网站收集的现有公共大规模数据集(例如MS COCO)并不关注特定场景。而且,从特定场景收集的流行数据集(例如,KITTI和Citypersons)在图像和实例的数量,分辨率和多样性方面受到限制。为了尝试解决该问题,我们构建了一个多样化的高分辨率数据集(称为TJU-DHD)。该数据集包含115,354张高分辨率图像(其中52%图像的分辨率为1624×1200像素,而48%图像的分辨率至少为2,560×1,440像素)和709,330个标记的对象,它们在比例和外观上存在较大差异。同时,该数据集在季节方差,照度方差和天气方差方面具有丰富的多样性。此外,进一步建立了新的多样化行人数据集。使用四种不同的检测器(即一级RetinaNet,无锚FCOS,二级FPN和Cascade R-CNN),进行了有关目标检测和行人检测的实验。我们希望新建的数据集可以帮助促进这两个场景中目标检测和行人检测的研究。 天津大学 | 参与讨论

代码 忒修斯之BERT:通过渐进模型替换来压缩BERT

本文提出了一种新的模型压缩方法,通过逐次模替换来有效地压缩BERT。文中的方法首先将原始的BERT分解成几个模块,然后构造它们的紧致子结构。然后,随机地用它们的替代物替换原来的模块,训练紧凑的模块来模仿原始模块的行为。通过训练,文中逐渐提高了替换的可能性。通过这种方式,文中的方法在原始模型和紧凑模型之间带来了更深层次的交互。与已有的用于BERT压缩的知识提取方法相比,文中的方法不引入任何额外的损失函数。文中的方法在GLUE benchmark上优于现有的知识提取方法,展示了模型压缩的新视角 加州大学圣地亚哥分校 | 参与讨论

通过双层神经网络实现快速高质量人脸动作转换合成

人脸动作控制一直是CV应用领域的一个问题,之前的方法通常需要多张样本图片进行Few-Shot推导,生成的合成人脸质量清晰度也较差。为解决这些问题,本文提出了一个基于神经网络的人脸渲染框架,能够从一张照片中创建不同姿态和表情的人脸。本文将人脸的特征分解为两层来进行建模。第一层是由一个小神经网络合成的姿态相关的粗糙图像,主要包含低频信息。第二层包含独立于姿势的纹理图像,主要是高频细节,接下来经过映射添加到前面提到的低频图像中,以保证合成人脸的清晰度和细节质量。本文提出的方法在视觉质量和速度方面相对之前的方法有显著提高,能够在移动端进行部署。 ECCV 2020 | 参与讨论

事件-事件关系抽取的联合限制约束学习

理解自然语言需要认识到多个事件提及在结构上和时间上是如何相互作用的。在这个过程中,人们可以诱导出事件复合体,这些复合体组织了多粒度的事件,它们之间交织着时间顺序和成员关系。由于这些关系现象缺乏联合标注的数据,以及它们所阐述的结构的限制,研究人员提出了一个联合约束学习框架来对事件-事件关系进行建模。具体来说,该框架通过将这些约束条件转换为可微分的学习目标,在多个时间关系和子事件关系内和跨时间关系中实施逻辑约束。实验结果表明,联合约束学习方法有效地补偿了联合标记数据的缺乏,并在时间关系提取和事件层次结构构建的基准上优于当前最优方法,能够取代常用但更昂贵的全局推理过程。研究人员还提出了一个很有前景的案例研究,展示了该方法在外部语料库上诱导事件复合体的有效性。 宾夕法尼亚大学 | 参与讨论

教程 贝叶斯深度学习研究总结

一个综合的人工智能系统应该不止能“感知”环境,还要能“推断”关系及其不确定性。深度学习在各类感知的任务中表现很不错,如图像识别,语音识别。然而概率图模型更适用于inference的工作。这篇survey提供了贝叶斯深度学习(Bayesian Deep Learning, BDL)的基本介绍以及其在推荐系统,话题模型,控制等领域的应用。 知乎 | 参与讨论

最新《图算法: Neo4j实战》书籍

这本书是有使用Apache Spark或Neo4j经验的开发人员和数据科学家开始使用图算法的实用指南。尽管我们的算法示例利用了Spark和Neo4j平台,但无论您选择哪种图技术,这本书也有助于理解更一般的图概念。它解释了图算法如何描述复杂的结构和揭示难以发现的模式——从发现漏洞和瓶颈到检测社区和改进机器学习预测。您将通过实际示例演示如何在Apache Spark和Neo4j中使用图形算法,这两种图分析最常见的选择。 OReilly | 参与讨论

综述:自监督学习与知识蒸馏的碰撞

在本届 NeurIPS 大会上,来自谷歌、马里兰大学等著名研究机构的学者针对自监督学习这一火热的研究课题展开了讨论。在经历了数据增强大潮、对比学习魔改、MoCo 与 SimCLR 系列的相爱相杀等一系列波澜壮阔的自监督学习科研竞赛后,自监督学习研究也进入了深水区。除了研究如何提升自监督学习框架的通用数据表证性能、针对特定任务进行。本文将首先介绍自监督学习、知识蒸馏、半监督学习等相关领域的基础知识,进而解读本届 NeurIPS 上与自监督学习和知识蒸馏相关的 3 篇优秀论文,旨在抛砖引玉。 AMiner科技 | 参与讨论

新工具 微软亚洲研究院 | 开源平台MARO:资源调度优化的任意门

基于三年来与成员企业的合作研究,微软亚洲研究院发布了多智能体资源优化平台“群策 MARO”,并将其开源。MARO适用于由资源供需不平衡导致的资源利用率低的问题,而这样的问题广泛存在于多个行业的不同场景。如何更好地在不同参与者间以合理的成本提高资源利用率,为行业创造更大的利润空间,且为社会节省不必要的资源浪费,是MARO的使命。这其中,利用创新技术助力企业和组织在关键场景中高效配置资源、节能减排,也是微软可持续发展战略中的重要一环。 MSRA | 参与讨论

CompressAI:InterDigital开源基于学习的图像视频压缩研究库

随着深度学习的兴起,近年来不断有基于学习的图像视频编解码工作被提出,尽管距离大规模商用尚有距离(据该领域从业人员称,深度学习的编解码效果尚可,但计算量较大),但几乎你能想到的IT和互联网巨头都投入重兵研发,也许该领域正处于突破性创新爆发的前夜。近日,知名移动通信和视频技术研发公司InterDigital开源了基于学习的压缩库 CompressAI,相信对于该领域的研究者会有一定帮助。在其论文CompressAI: a PyTorch library and evaluation platform for end-to-end compression research介绍了这一开源库。 InterDigital | 参与讨论

开源深度学习框架tinygrad

不久前,黑客George Hotz开源了一个小型 Autograd Tensor 库 tinygrad,它介于PyTorch和micrograd之间,能够满足做深度学习的大部分要求。上线不到一个月,该项目在GitHub上已经获得1400星。 Github | 参与讨论

应用 自学习AI算法发现高性能材料

近年来,机器学习在化学领域的应用正以惊人的速度增长,在材料性能预测、新材料探索与设计等领域也取得了很大进展。但是,机器学习与实验过程的直接耦合还存在巨大的挑战。

近日,一个包括美国国家标准与技术研究所(NIST)在内的多机构研究团队在 AI 研究领域取得了又一项重要研究成果:他们开发出了一种名为 CAMEO 的 AI 算法,该算法在不需要科学家额外训练的情况下,自主发现了一种潜在的实用新材料。利用 CAMEO 算法实现的 AI 系统,可以有效地减少科学家在实验室中花费的“反复”实验时间,同时最大限度地提高科研效率。 学术头条 | 参与讨论

用AI来理解大脑,“思想”背后大脑到底是怎么活动的?

贝勒医学院和莱斯大学的研究人员开发了一款人工智能(AI)模型,来帮助他们更好地理解作为思想基础的大脑计算。想要了解大脑是如何产生思想的,就需要先衡量思想。研究人员开发了一种称为“逆理性控制”的方法,来查看行为并推断出最能解释该行为的思想。研究人员将“逆理性控制”方法识别的思想与大脑活动联系起来,从而来研究建模思想的动态,以及大脑对这些思想的表示动态。通过提供估计思想和解释与之相关的神经活动的方法,可以帮助科学家理解大脑如何产生复杂行为,并为神经学提供新的研究思路。 Neuroscience News | 参与讨论

谷歌AI研究院:利用机器学习辅助"智能滚动应用"

谷歌推出的Recorder是一种新型录音应用程序,它通过利用设备上的机器学习(ML)来转录录音,突出显示音频事件并为标题提供合适标签,从而使录音更加智能,Recorder 使记录内容的编辑、共享和搜索变得更加容易。为增加内容的可导航性,谷歌研究人员引入了Smart Scrolling,这是Recorder中基于ML的一项新功能,该功能会自动标记记录中的重要部分,从每个部分中选择最具代表性的关键字,并将关键字显示在垂直滚动条上,以方便用户通过滚动关键字或点击关键字实现最感兴趣部分的快速导航。 Google AI | 参与讨论

经验 国内唯一ACL最佳论文得主冯洋:冲击最佳论文需要知道的事情

在本次演讲中,冯洋老师分别从读者和审稿人的角度对最佳论文的共性特征进行了总结,介绍了顶会评选最佳论文的评价标准,以及将论文写得逻辑自洽的方法,为有志于冲击最佳论文的研究者给出了撰写最佳论文的指导建议。 AI科技评论 | 参与讨论

以上是《智源社区AI周刊》第49期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请不吝赐教发至:editor@baai.ac.cn。谢谢大家。

内容中包含的图片若涉及版权问题,请及时与我们联系删除