导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第33期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况),数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

在过去一周(2020/07/27~2020/08/02)左右时间,首先值得推荐的内容有以下3方面:

  1. 论文《Controlling Fairness and Bias in Dynamic Learning-to-Rank》获得SIGIR 2020最佳论文奖。排序算法在很多在线平台将用户和项目进行匹配,在用户和项目双边考虑中,用户不仅评估排序算法的效益,而且排序算法本身也影响了项目提供端的效益。目前的排序算法中并没有考虑到在项目提供端的效益。基于这些考虑,本文提出了显性的基于组的公平排序算法。在保证公平的同时,本文的算法可以有效的优化排序算法的效果。(详情参见本周报“会议”栏目)
  2. ACM Multimedia 2020官方近日发布接收论文,共有1698篇论文投稿,472篇接受,接受率27.8%。ACM Multimedia 2020原定于2020年10月12-16日在美国西雅图举行。因为疫情原因将在线上虚拟进行。(详情参见本周报“会议”栏目)
  3. 7月27日,字节跳动副总裁、人工智能实验室主任马维英离职,下一站将赴清华大学智能产业研究院任职,加入正在筹备该产业院的原百度总裁张亚勤团队。在Guide2Research发布的2020全球顶尖计算机科学家排名中,马维英位居中国大陆第二位。(详情参见本周报“人物”栏目)

下面是各个要点的详情介绍。

论文推荐 控制排序中的公平性和偏差 Controlling Fairness and Bias in Dynamic Learning-to-Rank

本文是 SIGIR 2020 的最佳论文。排序算法在很多在线平台将用户和项目( 比如新闻产品音乐等) 进行匹配,在用户和项目双边考虑中,用户不仅评估排序算法的效益,而且排序算法本身也影响了项目提供端( 比如出版商) 的效益( 比如曝光度 ) 。目前的排序算法中并没有考虑到在项目提供端的效益。基于这些考虑,本文提出了显性的基于组( 比如相同出版商出版的文章) 的公平排序算法。在保证公平的同时,本文的算法可以有效的优化排序算法的效果。 论文下载

少样本生成式对话查询改写系统 Few-Shot Generative Conversational Query Rewriting

本文是 SIGIR 2020 的最佳短文。在对话场景中,用户提出的查询问题是人机交互的重要方式,然而由于用户在对话中做出的原始查询缺少上下文语境,现有的信息检索系统无法直接进行有效搜索。本论文提出了一种小样本学习方法,能够有效提升对话式检索中的查询重写效果。具体地,分别采取基于规则和自我监督学习的方式生成弱监督数据,用于微调预训练模型 GPT-2 增强对于用户问题的理解和改写能力。该模型在对话式检索任务 TREC Conversational Assistance Track 2019 中,与当前最好的问题改写模型相比准确率提高了 12 %。在无标注语料训练场景中,该模型准确率仍与 TREC CAsT 2019 最好的模型效果相当。这些实验表明,所提出的方法能够有效捕捉对话上下文信息,从而帮助提升对话式检索的效果。 论文下载

基于图卷积神经网 络 的物品组合推荐方法 Bundle Recomm endation with Graph Convolutional Networks

本文获得SIGIR 2020的最佳短文提名。该论文提出了一个基于图卷积神经网络的物品组合推荐方法,解决了物品组合推荐面临的挑战以及现有工作的诸多局限性。具体而言,该方法将用户、物品、物品组合三者统一为异构图,以此显式地建模用户与物品组合/单一物品的交互关系、以及物品组合与单一商品的从属关系。在此异构图上,提出单物品级别与物品组合级别的图卷积网络层,分别捕获单一物品交互数据和物品组合交互数据中的协同过滤信号,同时也刻画了物品组合蕴含的替代性、互补性等语义信息以及物品组合之间的相似性。 论文下载

RTM3D:一种自动驾驶场景下基于目标关键点的实时单目三维检测算法 RTM3D: Real-time Monocular 3D Detection from Object Keypoints for Autonomous Driving

本文发表于ECCV 2020。作者指出,大多三维检测器都将三维包围框到二维包围框的投影约束作为一个重要组成部分。二维框的四个边仅提供四个约束,且随着二维检测器的小误差,检测性能会急剧下降。与这些方法不同的是,作者团队提出的方法可以预测图像空间中三维包围框的九个透视关键点,然后利用二维和三维透视的几何关系来恢复三维空间中的维度、位置和方向。这种方法即使在关键点估计非常粗糙的情况下,也可以稳定地预测目标的属性,这使模型以较小的架构获得较快的检测速度。该方法的训练仅使用目标的3D属性,而无需额外网络或监督。该方法是第一个单目图像3D检测的实时系统,同时在KITTI基准数据集上实现了最优的性能。 论文下载

SSN:一种用于从点云检测多类目标的形状特征网络 SSN: Shape Signature Networks for Multi-class Object Detection from Point Clouds

本文发表于ECCV 2020。多类别三维目标检测的目标是对点云中的多类别目标进行定位和分类。本文作者指出,由于点云的非结构化、稀疏性和噪声等特性,一些有利于多类别区分的特征没有得到充分利用,例如形状信息。本文提出了一种新的三维形状特征来探索点云中的形状信息。通过引入对称、凸包(convex hull)和切比雪夫拟合等操作,所提出的形状特征不仅紧凑有效,而且对噪声具有较强的鲁棒性,可以作为一个软约束来提高特征的多类别区分能力。基于提出的形状特征,作者开发了用于三维目标检测的形状特征网络(SSN),该网络由金字塔特征编码部分,形状感知分组头和显式形状编码目标组成。实验表明,该方法在两个大规模数据集上的性能明显优于现有的方法。此外,该形状特征可以作为一个即插即用的组件,文中的消融实验表明它的有效性和良好的可扩展性。 论文下载

观点 Hinton教授:构建智能的机器模型应综合考虑监督与无监督方法进行协同训练

7月27日上午,第43届国际信息检索大会(SIGIR 2020)以线上会议的形式开幕。图灵奖获得者Geoffrey Hinton教授作为首位主题演讲者进行了题为“神经网络的新时代(The Next Generation of Neural Networks)”的主题报告。报告中,Hinton教授指出:人类大脑有10^14个神经元连接,而生命的长度只有10^9秒,因此人类是无法完全依赖有监督学习的方法完成所有神经元训练,而需要更多来自于无监督学习的帮助,受此启发,构建智能的机器模型也应综合考虑监督与无监督方法进行协同训练。 北京智源人工智能研究院

行业与政策 人脸识别再遭禁令:隐私与偏见争议未休,纽约州禁用面部识别软件

据外媒报道,纽约州立法机构刚刚通过了一项法令,禁止在学校中使用人脸识别和其他生物特征识别技术,直至2022年。该法案将由州长Andrew Cuomo签署。此前,旧金山、马萨诸塞州萨默维尔市等多地也已正式通过了在公共场所禁用人脸识别软件的法案。 机器之心

MIT最新报告:完全无人驾驶仍需10年

两年前,麻省理工学院成立了“未来工作特别小组”,这个小组目前有20多人,旨在研究“大众创新年代”的工作演变。近期,他们发表了一个最新的报告,重点关注了自动驾驶领域的进展。而得出的结论与马斯克大相庭径,他们认为全无人驾驶系统至少需要十年时间才能大面积商用。 新智元

AI安全验证公司CalypsoAI A轮融资1300万美元

公司成立于2018年,主要产品是Vespr平台,基于CalypsoAI的AI校核、验证和认定标准, 对抗机器学习库和自动模型压力测试工具。可以用来对AI模型的性能与可靠性进行理解、评分和跟踪。 Businesswire

数据 阿里巴巴联合学界开源大型 3 D 场景数据集

近期,阿里巴巴淘系技术部门的赵斌强、贾荣飞等与西蒙弗雷泽大学的张皓教授以及中科院计算所的高林、张凌霄多方共同合作,在CVPR 2020的“Workshop“Learning 3D Generative”中开源了大型3D场景数据集3D-FRONT(3D Furnished Rooms with layOuts and semaNTics),以填补目前学界在大规模高质量3D场景布局数据集上空白的现状。 机器之心

人物 字节AI副总裁 马维英离职,将加入清华张亚勤团队

7月27日,字节跳动副总裁、人工智能实验室主任马维英离职,下一站将赴清华大学智能产业研究院任职,加入正在筹备该产业院的原百度总裁张亚勤团队。在Guide2Research发布的2020全球顶尖计算机科学家排名中,马维英位居中国大陆第二位。 Tech 星球

代码 AANet:一种基于自适应融合的高效立体匹配网络

当前最流行的立体匹配方法大多使用代价高昂的3D卷积,在实际应用中十分受限。本项目作者提出了一种基于稀疏点的尺度内匹配代价聚合方法,以缓解在视差不连续时常见的边缘变厚问题。此外,作者团队还对传统的跨尺度匹配代价融合算法向神经网络近似,以处理大块的弱纹理区域。通过组合两个简单、轻量、互补的模块,形成一个高效的匹配代价融合架构(比GC-Net快41倍、PSMNet快4倍、比GA-Net快38倍),并在Scene Flow和KITTI立体匹配数据集上取得了具有竞争力的结果。 查看详情

金字塔立体匹配网络

这是一篇立体匹配领域中最具代表性的经典工作,代码已开源,具有很高的学习价值。本文将使用立体图像估计深度信息视为一个有监督的学习任务,即通过神经网络来达到这个任务目标。然而,当前基于图块匹配的孪生网络架构,缺少利用环境信息寻找不适定区域(遮挡区域,弱纹理区域等)的能力。本文提出了名为PSMNet的金字塔立体匹配网络,其主要由金字塔池化和3D卷积神经网络组成。金字塔池化模块通过聚合不同尺度和不同位置的环境信息构建匹配代价卷(cost volume)来充分利用全局环境信息。三维CNN通过将多个堆叠的沙漏网络与中间监督结合起来,去调整匹配代价卷。本文在KITTI2012和2015上面实现了最高精度。 查看详情

DaST:无需数据替代的对抗性攻击训练

本项目提出一种无需真实训练数据的对抗攻击替身模型,作者团队发现攻击者并不需要获取真实数据就能完成黑盒迁移攻击,即大量真实数据不再是攻击的障碍。在当前的黑盒对抗攻击技术中,一大类别是通过在替身模型上利用其梯度信息生成攻击,然后迁移到被攻击模型上实现黑盒攻击。作者为生成模型设计了一个多分支结构和标签控制损失,以处理合成样本的不均匀分布。生成模型生成的合成样本对替代模型进行训练,然后用攻击模型对样本进行标记。实验结果表明,与被攻击模型同列训练的基线模型相比,用DaST生成的替代模型可获得具有竞争力的性能。 查看详情

教程 SIGIR2020教程:交互式信息检索

由于信息检索(IR)通常是一个交互过程,因此研究交互式信息检索(IIR)是很重要的,在IIR中,我们将尝试建模和优化整个交互式检索过程,同时考虑用户可能与搜索引擎交互的许多不同方式。本教程系统地回顾了IIR的研究进展,重点介绍了IIR的模型、算法和评估策略的最新进展。首先对IIR的研究进行了广泛的概述,然后介绍了使用合作博弈框架进行IIR的形式化模型,并涵盖了决策理论模型,如接口卡模型和IIR的概率排序原理。接下来,它提供了一个审查一些代表特定的信息检索的技术和算法,如各种形式的反馈技术和多样化的搜索结果,然后讨论了应该如何评价一个信息检索系统和多种策略提出最近使用模拟的用户评价信息检索。本教程最后简要讨论了IIR中的主要开放挑战和一些最有前途的未来研究方向。 查看详情

ICML2020 Tutorial :因果强化学习

强化学习关心的是在交互和不确定的环境中有效地找到一个优化特定功能的策略。这两个学科分别发展的,它们之间几乎没有相互作用。然而,在现实中,它们对同一个构建块的不同方面进行操作,这使得他们紧密相连。在本教程中,讲者将基于这一观察结果引入统一的处理方法,并将这两个学科置于相同的概念和理论框架下。讲者表明,当这一联系完全建立时,就会出现许多自然的和普遍的学习问题,而这不能单独从任何一个学科中看到。特别地,讲者将讨论广义策略学习(在线、非策略和做微积分学习的组合)、何时何地干预、反事实决策(自由意志、自主、人与人工智能协作)、策略通用性和因果模仿学习等等。这种新的理解导致了对什么是反事实学习的更广泛的观点,并暗示了因果关系和强化学习并行研究的巨大潜力。讲者称这种新的研究为“因果强化学习”(简称CRL)。 ICML 2020

最新进展概述:澄清式提问辅助理解信息检索中的用户意图

用户使用搜索引擎的过程中,通常很难用单一的查询表达复杂的信息需求。在真实应用的过程中,用户需要根据当前搜索引擎的展示结果反复修改查询词。这一过程极大地增加了用户搜索的负担,影响了用户的搜索体验。近期,澄清式提问(Asking Clarifying Questions)的提出为该问题的解决提供了新的思路。该方法根据用户给出的查询提出相关问题,从而更好地理解用户意图,展示更符合用户需求的排序结果,提高用户对搜索过程的满意度。本文将概述该方向的一些最新研究进展。 Paperweekly

新工具 PyTorch 1.6发布:新增自动混合精度训练、Windows版开发维护权移交微软

近日,Facebook通过PyTorch官方博客宣布:PyTorch 1.6正式发布!新版本增加了一个amp子模块,支持本地自动混合精度训练。Facebook还表示,微软已扩大了对PyTorch社区的参与,现在拥有PyTorch在Windows上的开发和维护所有权。 机器之心

基于Pytorch的开源电影分析工具箱

本项目是一个基于Pytorch的开源电影分析工具箱,工具包包括电影爬虫、shot检测器、人脸识别与特征提取、人物识别与特征提取、地点特征提取、动作特征提取、语音特征提取等。 专知

关键词匹配利器FlashText

在实际开发工作中经常遇到,根据词表或映射表,查找或替换文本中内容,比较简单处理方法就是逐词匹配,这种处理方式不是高效的,而且代码写起来也会感觉很啰嗦,使用FlashText能够很好的帮助开发者解决这个问题。 Github

应用 Facebook开发玩德州扑克的AI

最近,Facebook的研究人员开发了一个名为ReBeL的通用人工智能框架。根据Facebook的说法,这个框架在单挑无限制的德州扑克游戏中明显优于人类表现,而且使用的领域知识比之前任何扑克人工智能都要少。他们断言ReBeL是开发通用多代理交互技术的一种方法,该算法可以部署在大规模、多代理环境中,预期的应用范围也很广,从拍卖、谈判、网络安全到自动驾驶都能用上。 新智元

谷歌提出贝叶斯群组检测法助力疫情防控

据统计,截至7月27日,美国新冠肺炎感染病例已超过427万,全球疫情形式仍十分严峻。对人群进行大规模的传染病筛查已成为非常重要和基础的防疫问题。然而,大海捞针,何其难也!为了提速超大规模感染筛查,来自谷歌的研究人员提出了一种基于贝叶斯方法的序列群体检测方法,能够大幅减少感染筛查所需测试,为类似于COVID-19的大流行检测提供了有效且快速可靠的检测方法。 将门创投

纽约雪城大学使用AI实现论文图像查重

来自纽约雪城大学的机器学习研究人员Daniel Acuna基于AI技术开发了一款论文图像查重软件,他用这款软件检查了3500篇论文的21,000张图像,在4小时内查出大约400张疑似重复的图像,这项技术或许将为学术造假乱象的解决带来曙光。 AI 科技评论

会议 SIGIR 2020最佳论文公布,清华大学揽多个奖项

7月29日晚,第43届国际“信息检索研究与发展”年会(SIGIR)最佳论文正式公布。本届会议最佳论文奖由康奈尔大学Thorsten Joachims团队获得,共同一作是Marco Morik和Ashudeep Singh。清华大学本次获得了多个奖项:最佳论文荣誉提名奖由清华大学张帆(一作)等获得,智源学者刘奕群也是作者之一;两个最佳短论文奖也都被清华大学摘取,第一作者分别是常健新和于是。值得一提的是,于是目前是大三学生,智源学者刘知远是指导老师之一。 北京智源人工智能研究院

ACM Multimedia 2020论文出炉

ACM Multimedia 2020官方近日发布接收论文,共有1698篇论文投稿,共有472篇接受,接受率27.8%。ACM Multimedia 2020原定于2020年10月12-16日在美国西雅图举行。因为疫情原因将在在线虚拟进行。 专知

经验 如何自学成为数据科学家或AI工程师?

人们在尝试学习数据科学、人工智能或机器学习时所面临的最大拦路虎就是时间和金钱。自学是一门艺术,需要足够的自律、勤奋和专注。利用得当的话,它能让你灵活地将学习与工作结合起来。然而,自学数据科学、人工智能或机器学习的开始阶段会非常艰难,但请相信这一切都是值得的。自学时取得良好进展的 关键是按照自己的节奏学习。本文将分享一条自学数据科学、人工智能和机器学习时可以遵循的道路,同时也能帮助大家在学习新事物上取得良好进展。 机器之心

以上是《智源社区AI周刊》第33期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,欢迎评论区留言。谢谢大家。

特约编辑:刘布楼 常政 贾伟 刘沂喆 付建振

内容中包含的图片若涉及版权问题,请及时与我们联系删除