导读
为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第76期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。
过去一周(2021/05/31~2021/06/06),值得关注的内容有以下3方面:
一、NAACL 2021将于2021年6月6日至11日以在线会议的形式在墨西哥城举办,近日最佳论文公布,来自罗切斯特大学和腾讯的研究人员《视频辅助无监督语法归纳》获得最佳长论文,此外还包括2篇杰出长论文和1篇最佳短论文和2篇杰出短论文。(详情参见本周报“会议”栏目)
二、目前,国际主流的大模型主要基于英文语料研发,智源研究院作为AI基础建设的先行者,成立了由智源研究院学术副院长唐杰教授领衔,100多位科研骨干共同参与的“悟道”团队,启动面向中文的大规模智能模型研发工作。“悟道”模型系统将构建“大模型、大平台、大生态”,持续研发超大规模智能模型,围绕大模型研发,构建大规模算力平台,同时对外开放模型能力,“赋智”各行业发展,构建大模型生态。今年3月20日,智源研究院发布了中国首个超大规模智能模型“悟道1.0”,训练出中文、多模态、认知、蛋白质预测等系列模型。经过不到3个月的持续更新迭代,“悟道2.0”实现了更高层面的跨越。(详情参见本周报“新工具”栏目)
三、Jeff Hawkins 是美国著名计算机科学家与神经科学家,美国工程院院士,目前任职于美国加州Numenta 公司。2004年,他曾出版科普著作《On Intelligence》,把人工智能这个陌生概念播撒到无数人心中。在本届智源大会上,他发表了题为「The Thousand Brains Theory - A roadmap for creating machine intelligence」的演讲。作为公司的联合创始人,Jeff 为 Numenta 公司设定了双重使命:理解大脑工作的机制、根据大脑工作的机制创造机器智能。在 Jeff Hawkins 看来,想要最迅速地创造真正的智能机器,首先需要理解人类大脑是如何工作的。(详情参见本周报“观点”栏目)
下面是各个要点的详情介绍。
论文推荐
加州大学圣巴巴拉分校 | FoveaTer:用于图像分类的Foveated Transformer
中国科学院大学 | StyTr^2:首个基于Transformer的图像风格迁移
StyTr^2: Unbiased Image Style Transfer with Transformers
视觉关系推理 | 以人为中心的关系分割:数据集和解决方案
华为 | 重温用于目标检测的知识蒸馏
Revisiting Knowledge Distillation for Object Detection
现有的目标检测蒸馏解决方案依赖于教师模型和真实标签的可用性。我们提出了一个新的视角来解决这种限制。在我们的框架中,学生首先使用教师生成的伪标签进行训练,然后使用标记数据进行微调(如果有)。大量实验证明了对现有目标检测蒸馏算法的改进。此外,在这个框架中将教师和真实数据蒸馏解耦提供了有趣的特性,例如:1) 使用未标记的数据进一步提高学生的表现,2) 结合不同架构的多个教师模型,甚至具有不同的对象类别,以及 3 ) 减少对标记数据的需求(只有 20% 的 COCO 标签,该方法实现了与在整个标签集上训练的模型相同的性能)。此外,这种方法的一个by-product是域适应的潜在用途。我们通过广泛的实验验证了这些特性。
Apple | 没有注意力的Transformer
我们提出了Attention Free Transformer (AFT),这是一种高效的 Transformer 变体,它消除了对dot product self attention的需要。在 AFT 层中,key和 value首先与一组学习的位置偏差相结合,其结果以element-wise与查询相乘。 这个新操作的内存复杂度为线性 w.r.t. 上下文大小和特征维度,使其兼容大输入和模型大小。 我们还介绍了 AFT-local 和 AFT-conv,这两种模型变体在保持全局连接的同时利用了局部性和空间权重共享的思想。 我们对两个自回归建模任务(CIFAR10 和 Enwik8)以及一个图像识别任务(ImageNet-1K 分类)进行了大量实验。 我们展示了 AFT 在所有基准测试中都表现出具有竞争力的性能,同时提供了出色的效率。
观点
真正实现与人更类似的智能!Jeff Hawkins:创造机器智能的路线图
Jeff Hawkins 是美国著名计算机科学家与神经科学家,美国工程院院士,目前任职于美国加州Numenta 公司。2004年,他曾出版科普著作《On Intelligence》,把人工智能这个陌生概念播撒到无数人心中。在本届智源大会上,他发表了题为「The Thousand Brains Theory - A roadmap for creating machine intelligence」的演讲。作为公司的联合创始人,Jeff 为 Numenta 公司设定了双重使命:理解大脑工作的机制、根据大脑工作的机制创造机器智能。在 Jeff Hawkins 看来,想要最迅速地创造真正的智能机器,首先需要理解人类大脑是如何工作的。
行业与政策
德国通过全球首个 L4 自动驾驶法案
L4级自动驾驶汽车在公共道路行驶,这一场景已不再遥远。5月28日,德国联邦委员会的全体会议通过一项立法,允许L4级完全无人驾驶汽车于2022年出现在德国的公共道路。事实上,该法案自2017年就已开始根据德国的自动驾驶发展进程多番修订,并在今年2月10日增添L4级自动驾驶汽车在公共道路行驶的法律条文。本次德国联邦委员会通过该项法案,意味着这项法案将正式生效。同时也意味着在自动驾驶的应用上,德国已迈出极具建设性的一大步。
数据
最新综述:对话式检索数据集汇总
代码
浙江大学 | TCVOM:注意力引导的视频物体抠图
本文提出了一种新的基于深度学习的视频物体抠图(Video Object Matting)方法,可以实现时间相干抠图结果。它的关键组件是一个基于注意力的时间聚合模块,它可以最大限度地提高图像抠图网络对视频抠图网络的强度。该模块计算特征空间中沿时间轴彼此相邻的像素的时间相关性,以对运动噪声具有鲁棒性。我们还设计了一个新颖的损失项来训练注意力权重,这大大提高了视频抠图性能。此外,我们展示了如何通过使用一组稀疏的用户注释关键帧微调最先进的视频目标分割网络来有效解决trimap 生成问题。为了促进视频抠图和trimap生成网络的训练,我们构建了一个大规模的视频抠图数据集,其中包含 80 个训练和 28 个验证前景视频剪辑,带有ground-truth alpha 遮罩。实验结果表明,我们的方法可以为具有外观变化、遮挡和快速运动的各种视频生成高质量的 alpha 遮罩。
国防科技大学 | DNANet:用于红外小目标检测的密集嵌套注意力网络
北京交通大学 | 基于双语交互信息的自适应训练解决神经机器翻译
教程
综述 | 用于组合优化的强化学习
中国人民大学 | 单目物体姿态检测和跟踪的深度学习技术:调研
由于其在自动驾驶、机器人和增强现实等许多领域的广泛应用,物体姿态检测和跟踪最近引起了越来越多的关注。在物体姿态检测和跟踪的方法中,深度学习是最有前途的一种,其性能优于其他方法。然而,缺乏对基于深度学习的方法的最新发展的调查研究。因此,本文对属于深度学习技术路线的物体姿态检测和跟踪的最新进展进行了全面回顾。为了更深入地介绍,本文的范围仅限于以单目 RGB/RGBD 数据为输入的方法,涵盖三种主要任务:实例级单目物体姿态检测、类别级单目物体姿态检测、单目物体姿态跟踪。在我们的工作中,详细介绍了有关检测和跟踪的指标、数据集和方法。还介绍了当前最先进方法在几个公开可用数据集上的比较结果,以及富有洞察力的观察和鼓舞人心的未来研究方向。
新工具
智源|全球最大智能模型“悟道2.0”重磅发布
目前,国际主流的大模型主要基于英文语料研发,智源研究院作为AI基础建设的先行者,成立了由智源研究院学术副院长唐杰教授领衔,100多位科研骨干共同参与的“悟道”团队,启动面向中文的大规模智能模型研发工作。“悟道”模型系统将构建“大模型、大平台、大生态”,持续研发超大规模智能模型,围绕大模型研发,构建大规模算力平台,同时对外开放模型能力,“赋智”各行业发展,构建大模型生态。今年3月20日,智源研究院发布了中国首个超大规模智能模型“悟道1.0”,训练出中文、多模态、认知、蛋白质预测等系列模型。经过不到3个月的持续更新迭代,“悟道2.0”实现了更高层面的跨越。
诺亚开源因果结构学习工具包gCastle
gCastle(A python library for Causal Structure Learning)是华为诺亚GTS大脑与因果基础研究团队联合自研的一个纯Python开发的因果结构学习工具包,其功能愿景是为业界提供一套完整的因果结构学习工具链及多个真实应用场景的因果数据集,以期弥补业界在因果发现工具链完整性和Benchmark数据集上的匮乏。gCastle共包含三个主要模块:因果发现算法库,数据生成模块及因果发现性能评测模块。
应用
DeepMind 训练 AI 玩足球,走位堪比人类
DeepMind一直尝试用AI来玩一些复杂多变的策略性游戏,以训练出接近人类智力水平的智能体。在足球运动中,团队协作是智能体训练面临的最大挑战,它不仅要对足球规则、技巧十分娴熟,还要对赛场上的局势,队友和对手的位置、以及目标有更好的理解,以做出更理性的决策。DeepMind表示,此次升级的AI智能体训练出了对他人的“意识”,能够在更大的时空维度上,与队友协同配合完成更复杂的作战策略。最近DeepMind发表了一篇名为“From Motor Control to Team Play in Simulated Humanoid Football”的技术论文,同时发布了演示视频。
使用深度核学习量化医学图像分析中的预测不确定性
。
联邦学习用于短期住宅能源需求预测
。
会议
NAACL2021最佳论文出炉
NAACL 2021将于2021年6月6日至11日以在线会议的形式在墨西哥城举办,近日最佳论文公布,来自罗切斯特大学和腾讯的研究人员《视频辅助无监督语法归纳》获得最佳长论文,此外还包括2篇杰出长论文和1篇最佳短论文和2篇杰出短论文。
以上是《智源社区AI周刊》第76期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请在下方评论区留言指出。谢谢大家。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢