导读 为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第6期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况),数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

过去一周(2020/01/13~2020/01/19),值得关注的内容有以下3方面:

  1. 微众银行首席人工智能官(CAIO)、香港科技大学教授杨强将担任国际人工智能大会 AAAI 2021 General Chair。2020年前AAAI仅设 Program Committee Chair 、没有 General Chair 。由于近来投稿量剧增,为了使 Program Committee Chair 能把精力集中在稿件学术质量把控上,2020年起开始设置 General Chair。杨强教授成为AAAI大会历史上第二位General Chair、华人首次。(详情参见本周报“人物”栏目)
  2. Jeff Dean发文回顾和评估在过去一年中所做的研究工作,并展望在未来几年中要解决什么样的问题。这篇文章是对Google研究人员和工程师在2019年期间所做的一些工作的总结,包括AI道德伦理、AI社会效益、手机智能辅助、健康、量子计算、机器学习算法、自然语言理解、机器人技术等诸多方面的研究成果。(详情参见本周报“行业与政策”栏目)
  3. 人脸交换是DeepFake的一种应用。就是将已有的人脸提取出来,用其他人脸代替,已被MixBooth和SnapChat之类的应用程序所普及。但是因为该技术门槛逐渐降低,也引发人们对该技术被滥用的担忧。商汤研发部门SenseTime Research的研究人员与新加坡南洋理工大学合作,设计了一个新的大规模基准DeeperForensics-1.0来检测人脸伪造,该基准是同类产品中最大的,质量和多样性都很高,比其他数据集更加接近现实世界场景。(详情参见本周报“数据”栏目)

下面是各个要点的详情介绍。

论文推荐 额外高斯先验目标,缓解负多样性无知 Data-dependent Gaussian Prior Objective for Language Generation

近年来,语言生成模型取得了显着进步,尤其是在深度神经网络(DNN)的快速发展下。有几种典型的语言生成模型,例如序列到序列(seq2seq)模型,生成对抗网络(GAN),变分自编码器(VAE)和自回归网络。为了缓解负多样性无知的问题,我们添加了一个额外的高斯先验目标,以增加一个额外的Kullback-Leibler(KL)偏离损失项来增强当前的MLE训练。通过比较两个概率分布来计算额外损失,第一个概率分布来自详细的模型训练预测,第二个概率分布来自于真实的单元空间分布,被定义为一种与数据相关的高斯先验分布。然后通过KL散度项将建议的数据相关高斯先验目标(D2GPo)注入到最终损失中。D2GPo与常用的与数据无关的高斯先验(L2正则化)相距甚远,L2正则化的目的是简化MLE的训练,这也直接加到了MLE损失中。实验结果表明,该方法可以有效地利用数据中更详细的先验信息,并可以显着提高典型语言生成任务的性能,包括有监督和无监督的机器翻译,文本摘要。 来源:ICLR 2020 | 论文下载

Cascade RPN算法提升RPN模块的性能 Cascade RPN: Delving into High-Quality Region Proposal Network with Adaptive Convolution

目前,性能高的目标检测网络大都为two-stage(RPN+R-CNN)架构,相对于R-CNN,很少有研究专门去提升RPN的性能。因此,论文着重研究如何提升RPN的性能,解决其探索性的achor定义以及探索性的feature与anchor对齐的局限性。anchor由尺寸和长宽比定义,常规算法会使用一系列不同尺寸和长宽比的anchor来充分覆盖检测目标。设定合适的尺寸和长宽比是提升性能的关键,这通常需要tuning。论文提出Cascade RPN来系统地解决前面提到的问题,算法主要有两个特点:Cascade RPN使用单anchor,并且结合anchor-based和anchor-free的准则来进行正样本的判定;为了获得多stage精调的好处并且保持特征和anchor对齐,Cascade RPN使用自适应卷积来精调每个stage的anchor,自适应卷积可以当作是个轻量级的RoI Align层。Cascade RPN简单但有效,能比原生RPN高出13.4%AR,并且能集成到two-stage检测器中,如Fast R-CNN和Faster R-CNN分别提升3.1%和3.5% 来源:NeurIPS 2019 | 代码链接 | 论文下载

姿态辅助下的多相机协作实现主动目标追踪 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking

对相机进行智能控制从而实现目标追踪是一项非常具有挑战性的任务。由于环境的复杂性,相机所接收到的视觉信息常常是不完美的,比如环境中存在的障碍物对目标极容易造成遮挡,目标距离远的情况下形态变得不够清晰,相似的背景容易导致目标的混淆等等。传统的方法只靠视觉信息做追踪,在视觉信息质量不够高的情况下很容易导致相机追踪的失败。因此,本文提出引入相机姿态的多相机协同合作机制进行监控场景下的目标追踪,通过对比不同测试环境上的实验结果,本文证实了这种合作机制的有效性和可拓展性。 来源:AAAI 2020 | 项目地址 | 论文下载

面向文本识别的去耦注意力网络 Decoupled Attention Network for Text Recognition

伴随着深度学习的快速发展,近些年文本识别领域出现了许多新方法。注意力机制是当前文本识别最先进的方法之一,其在场景文本识别任务上取得了尤为出色的效果。然而,当前注意力机制的对齐操作依赖于上一步的解码信息,这就导致了一旦上一步解码出错或具有迷惑性,注意力机制的对齐将产生错误,且此错误会累积传播。这一问题在较长的手写文本上体现得较为明显。为了解决这种情况,本文提出了一种去耦注意力网络(DAN),该网络将注意力的对齐阶段从解码器中解耦出来,即进行对齐时不再依赖于上一步的解码信息。实验表明,DAN在有效缓解了注意力机制的对齐错误问题,并在手写和场景两种文本识别场景上取得了SOTA或相当的效果。 来源: AAAI 2020 | 代码链接 | 论文下载

引入评估模块,提升机器翻译流畅度和忠实度 Modeling Fluency and Faithfulness for Diverse Neural Machine Translation

神经机器翻译模型通常采用 Teacher Forcing 策略来进行训练,在该策略下,每个源句子都给定一个 GroundTruth,在每个时间步翻译模型都被强制生成一个 0-1 分布,即只有 Ground Truth 的词语的概率为 1,其他词语的概率为 0。通过这种方式,强制每个时间步生成对应的 GroundTruth 词语。而实际情况是即使是在训练集上,翻译模型也不能每次都输出 GroundTruth 词语作为翻译,甚至有时候 Ground Truth 词语的概率很小,但是,0-1 分布将所有的概率分布仅通过 Ground Truth 词语进行梯度回传,词表中其他的词语均被忽略,从而影响了参数训练。本文提出在神经机器翻译模型中引入一个评估模块,对生成的译文从流利度和忠实度两个方面进行评估,并用得到的评估分数用来指导训练阶段译文的概率分布,而在测试的时候,可以完全抛弃该评估模块,采用传统的 Transformer 模型进行解码。最终实验证明取得了性能的提升。 来源:AAAI 2020 | 论文下载 | 代码链接

行业与政策 Jeff Dean盘点谷歌AI 2019

在2020年到来之际,谷歌AI负责人Jeff Dean亲自撰文,回顾和评估了Google在过去一年中所做的研究工作,并展望在未来几年中要解决什么样的问题,包括AI道德伦理、AI社会效益、手机智能辅助、健康、量子计算、机器学习算法、自然语言理解、机器人技术等诸多方面。例如应用方面,在帮助障碍人群的过程中,对于患有ALS(渐冻症)和其他情况下会产生口齿不清或非标准语音的人,google技术实现了个性化语音到文本的转录,继而模拟患者健康时候的声音与家人交流;理论研究领域,在探索权重不可知神经网络中,Google展示了如何无需任何训练步骤即可更新有趣的神经网络体系结构以更新评估模型的权重。这可以使体系结构搜索的计算效率更高。权重无关神经网络可以在各种不同的权重参数下执行任务。 来源:Google | 原始报道 | 中文报道

2020年国家自然科学基金项目指南正式公布

国家自然科学基金委员会在其官网上发布了2020年项目指南,项目指南共344页,内容包括2020年国家基金委改革的一系列举措、申请须知、申请项目的规定,特别是新的限项申请规定,以及各类项目的申请指南等重要内容。是高等学校、科研院所等机构从事科学研究工作的科研人员,以及参与科技管理的科技政策研究的人员的重大参考。特别注意新的限项规定变化要点:申请当年资助期满的项目不计入申请和承担总数范围。具有高级专业技术职务(职称)的人员,申请(包括申请人和主要参与者)和正在承担(包括负责人和主要参与者)以下类型项目总数合计限为2项。具有高级专业技术职务(职称)的人员作为主要参与者正在承担的 2019 年(含)以前批准资助的项目不计入申请和承担总数范围,2020 年(含)以后申请(包括申请人和主要参与者)和批准(包括负责人和主要参与者)项目计入申请和承担总数范围。 来源:国家自然科学基金委员会 | 报道链接

苹果2亿美元收购Xnor.ai

苹果收购了西雅图初创公司 Xnor.ai,交易金额或高达 2 亿美元。这家创业公司专门研究基于边缘的低功耗人工智能工具,能在智能手机、相机和无人机等边缘设备中有效部署 AI 算力。苹果近年来频繁收购 AI 创业公司。据 CB Insights 统计,苹果在 2019 年 AI 收购方面的进度已大幅领先于 Google,Microsoft,Facebook 和 Amazon 等科技巨头。2019 年 5 月,苹果首席执行官蒂姆 • 库克 (Tim Cook) 在接受 CNBC 采访时透露,过去六个月中苹果其实已经收购了 20 至 25 家公司,平均每两到三周就收购一家新公司。不过,在能够公开查询到的苹果收购案例中,Xnor.ai 是边缘计算领域的第一例,这或者代表着苹果进军边缘计算的雄心。对于边缘计算,业内的共识是,它正在成为继云计算、AI 之后的又一科技浪潮。 来源:techcrunch | 原始报道 | 中文报道

人物 杨强教授将担任AAAI2021国际人工智能大会主席

微众银行首席人工智能官(CAIO)、香港科技大学教授杨强将担任国际人工智能大会 AAAI 2021大会General Chair。2020年前AAAI仅设 Program Committee Chair 、没有 General Chair 。由于近来投稿量剧增,为了使 Program Committee Chair 能把精力集中在稿件学术质量把控上,2020年起开始设置 General Chair 。杨强教授成为AAAI大会历史上第二位 General Chair、华人首次。杨强是香港科技大新明工程学讲座教授,计算机科学与工程系主任,同时是香港科大大数据研究所主任。他曾经是华为诺亚方舟实验室主任(2012-2014)。他是AAAI Fellow, IEEE Fellow, AAAS Fellow, IAPR Fellow和ACM杰出科学家。他的主要研究兴趣是人工智能和数据挖掘。 来源:专知 |报道链接

数据 商汤科技发布人脸检测数据集DeeperForensics-1.0

人脸交换是DeepFake的一种应用。就是将已有的人脸提取出来,用其他人脸代替,已被MixBooth和SnapChat之类的应用程序所普及。但是因为该技术门槛逐渐降低,也引发人们对该技术被滥用的担忧。商汤研发部门SenseTime Research的研究人员与新加坡南洋理工大学合作,设计了一个新的大规模基准DeeperForensics-1.0来检测人脸伪造,该基准是同类产品中最大的,质量和多样性都很高,比其他数据集更加接近现实世界场景。100位计算机专家对DeeperForensics-1.0中包含的视频子集质量进行排名时,报告指出与其他流行的Deepfake检测语料库相比,DeeperForensics-1.0在规模上的真实性均领先。 来源:新智元 |报道链接

代码 使用AlexeyAB版Darknet

自从Joseph Redmon提出了yolov3后,其darknet仓库已经获得了16k的star,足以说明darknet的流行。该作者最新一次更新也是一年前了,没有继续维护。不过自来自俄国的大神AlexeyAB在不断地更新darknet, 不仅添加了darknet在window下的适配,而且实现了多种SOTA目标检测算法。AlexeyAB也在库中提供了一份详细的建议,从编译、配置、涉及网络到测量指标等,一应俱全。通过阅读和理解AlexeyAB的建议,可以为我们带来很多启发。 来源:CVer |报道链接| 代码链接

Seaborn入门:详解barplot和countplot

Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。但应强调的是,应该把Seaborn视为matplotlib的补充,而不是替代物。本文详细介绍了其中的barplot和countplot模块。 来源:Python中文社区 |报道链接

Python数据可视化散点图

散点图(Scatter)又称散点分布图,是以一个变量为横坐标,另一个变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系。散点图不仅可传递变量间关系类型的信息,还能反映变量间关系的明确程度。通过观察散点图数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。 来源:机器之心 |报道链接

教程 【课程】CS234:强化学习

本课程是斯坦福大学的最新课程CS234——强化学习,主讲人是斯坦福大学Emma Brunskill,她是斯坦福大学计算机科学助理教授,任职斯坦福大学人类影响力实验室、斯坦福人工智能实验室以及统计机器学习小组,主要研究强化学习。要实现人工智能的梦想和影响,需要能够学会做出正确决策的自主系统。强化学习是这样做的一个强有力的范例,它与大量的任务相关,包括机器人、游戏、消费者建模和医疗保健。本课程通过讲课、书面作业和编码作业的结合,学生将精通强化学习的关键思想和技术。 来源:斯坦福大学 | PPT下载 | 课程链接

【课程】CSC311机器学习导论

多伦多大学Amir-massoud Farahmand和Emad A. M. Andrews博士开设了机器学习导论课程。机器学习(ML)是一组技术,它允许计算机从数据和经验中学习,而不需要人工指定所需的行为。ML在人工智能作为一个学术领域和工业领域都变得越来越重要。介绍了机器学习的主要概念和思想,并概述了许多常用的机器学习算法。它还可以作为更高级的ML课程的基础。 来源:多伦多大学 | 课程链接

【书籍】基于python的深度学习异常检测

本书使用Python中的Keras和PyTorch,重点介绍如何将各种深度学习模型应用于半监督和非监督异常检测任务。这本书首先解释了异常检测是什么,它的用途和重要性。在介绍了使用Python中的Scikit Learn进行异常检测的统计和传统机器学习方法之后,本书随后介绍了深度学习,详细介绍了如何在Keras和Pythorch中建立和训练深度学习模型,然后将重点转移到以下深度学习模型的应用到异常检测:各种类型的自动编码器、受限的Boltzmann机器、RNN和LSTM,以及时间卷积网络。这本书探索无监督和半监督异常检测以及基于时间序列的异常检测的基础知识。在这本书的最后,你将有一个全面的了解异常检测的基本任务,以及各种方法来接近异常检测,从传统的方法到深入学习。此外,还向您介绍了Scikit Learn,并能够在Keras和PyTorch中创建深度学习模型。 来源:apress | 书籍链接

【书籍】机器学习工程

机器学习现在已经渗透到我们工作生活的方方面面,关于机器学习算法原理的书籍有很多经典教科书,但是实际工程生产系统中的机器学习落地书籍却乏善可陈。来自Gartner机器学习技术负责人Andriy Burkov又一力作机器学习工程《Machine Learning Engineering》,专注机器学习项目实施的工程方面。诸如数据收集、存储、预处理、特性工程以及模型的测试和调试、模型在生产环境中的部署和退出、运行时和后期维护等问题。 来源:Gartner | 书籍链接

【深度】模型压缩究竟在做什么?

模型压缩是一种缩小已经训练好的神经网络的技术。仅仅使用一小部分计算资源,压缩过的模型的性能,就能和原始模型类似。然而,许多应用程序的瓶颈其实是训练原始的、压缩之前的大型神经网络,没有鸡哪有蛋呀。例如,我们可以在消费级GPU (12gb内存)上训练BERT-base,但需要在谷歌TPU (64gb内存)上训练BERT-large,这阻止了许多尝试训练预训练语言模型的人。模型压缩领域的结果告诉我们,我们得到的最终压缩结果通常比我们最初训练的大型模型的参数少得多。但是为什么一定要模型压缩呢?为什么不能从头训练一个高性能的小模型呢?在这篇文章中,我们将探索从零开始训练小模型所涉及的障碍。我们将讨论为什么模型压缩有效,以及两种提高内存效率的训练方法:超参数化界限和一种能够减少或消除对事后模型压缩的需求的优化算法 来源:mitchgordon | 中文链接 | 原始链接

新工具 PyTorch 1.4最新版发布

紧接着 TensorFlow 更新到 2.1 版之后,PyTorch 在今天也更新到了 1.4 版本。本次更新的重点是增加了很多重要的新特性,包括给用户提供 Build 级别的移动端定制化支持、增加分布式模型并行训练、让 Java 程序能够运行 TorchScript 等。此外还有 JIT、C++、分布式训练、Eager 前端、PyTorch Mobile 等方面的功能改进和 Bug 修复。值得注意的是,本次 PyTorch 更新是最后一个支持 Python2 的版本,同时也是最后一个支持 C++11 的版本。官方提示说,用户应当开始迁移到 Python3,并使用 C++14 开始编译工作。对于其他详细信息,感兴趣的读者可以查阅更新文档。 来源:机器之心 |报道链接| 文档链接

清华大学发布大数据可视化设计框架AutoVis

大数据时代,数据应用需求多种多样,数据特点亦发生本质上的变化。智能硬件的丰富与普及,互联网、物联网、移动化、智能化的浪潮,给数据可视化带来新的机遇与挑战。如下图所示,我们简要梳理了数据可视化(系统)在大数据应用中所面临的一些关键问题,例如数据规模增加,屏幕像素空间有限,数据可视化系统的数据采样能力与绘制效率问题突出。数据多样的特点要求数据可视化系统不仅需要支持更多的可视化方法,也要具有良好的系统可扩展性以适应不断出现的新数据、新需求。数据快速变化的特点要求数据可视化系统能够快速构建新的图表,及时捕捉数据变化。由于不同使用者所关注数据特征的差异及数据探索的需求,可视化图表的交互性在大数据时代将更加重要。AutoVis是清华大学“大数据系统软件国家工程实验室”自主研发的大数据可视化设计框架。面向大数据应用,特别是工业场景,此框架提供了一种新的数据生成图表和看板的方式,具有表达能力丰富、简单易用、高可扩展、高效率等特点,已应用于中车四方车辆有限公司、石家庄天远科技集团有限公司等工业企业。 来源:数据派THU |报道链接| 使用链接

AutoGluon自动生成高性能模型

AutoGluon旨在使开发者对历来不得不做出的许多决策进行自动化。通常,诸如超参数调整之类的任务需要手动执行,这就要求科学家预测超参数(表示构建AI模型时所做的选择)将如何影响模型训练。另一个通常由人监督的任务称为神经架构搜索,它涉及复杂的工程,至少在一定程度上,开发人员必须为其各自的模型确定最优设计。为此,AutoGluon可以通过自动调整默认范围内的选择来生成仅需三行代码的模型,而这些默认范围在已知范围内可以很好地完成特定任务。开发者只需指定他们准备好其训练好的模型,作为响应,AutoGluon就会利用可用的计算资源在分配的运行时中找到最强模型。它以亚马逊和微软三年前的研究工作Gluon为基础,后来又在Apache MXNet和微软的Cognitive Toolkit中发布。Gluon是一个机器学习界面,允许开发者使用一组预先构建和优化好的组件来构建模型,而AutoGluon则端到端地处理开发过程。 来源:venturebeat | 原始报道 | 中文报道

应用 Facebook AI宣布建立解决高级数学方程式的AI系统

近日,Facebook AI宣布建立了第一个使用符号推理解决高级数学方程式的AI系统。通过开发一种将复杂的数学表达式表示为一种语言的新方法,然后将解决方案替换序列到序列神经网络的翻译问题,研究者建立了一个在求解积分问题和一阶、二阶微分方程方面都优于传统计算的系统。以前,这类问题被认为超出了深度学习模型的范围,因为求解复杂方程需要精确而不是近似。神经网络擅长于通过近似来学习如何成功,比如识别一个特定的像素模式可能是一个狗的图像,或者一个句子在一种语言中的特征与另一种语言中的特征相匹配。Facebook AI表示,他们提出的解决方案是一种全新的方法,可将复杂的方程式透视语言中的句子,因此他们能够在神经机器翻译(NMT)训练模型中充分利用成熟的技术,从而将问题从本质上转化为解决方案。 来源:Facebook AI | 中文报道 | 原始报道

香港科技大学、哈尔滨工程大学等提出EmotionCues,以分析学生课堂情绪变化

关于 AI 在课堂上所能完成的监控工作,很多人已经习以为常。「一位教授在授课结束后查看他的电脑。借助一款软件,他能看到这一整堂课中学生的情绪变化。在上课 30 分钟之后,大部分学生已经失去兴趣并开始走神,这也大概是他讲跑题的那个时间点。所以教授做了个记录,提醒自己以后不要跑题。」现实中的课堂大多还不是这个样子,但随着技术的发展,这样的情景会越来越普遍。近日,一篇有关课堂监控技术的论文刊登在《IEEE Transactions on Visualization and Computer Graphics》上。在论文中,来自香港科技大学、哈尔滨工程大学等机构的研究者提出了一种名为 EmotionCues 的系统。该系统主要关注如何记录学生面部表情,并据此来分析学生在课堂上的情绪变化、注意力集中程度。作者之一、香港科技大学计算机教授屈华民介绍说,这个系统「为教师提供了一种更快速、更方便去衡量学生在课堂上参与度的方法。」 来源:IEEE Spectrum | 原始报道 | 中文链接

DeepMind团队建立预测蛋白质3d结构的AI系统AlphaFold

DeepMind团队展示了人工智能研究如何驱动和加速新的科学发现。他们已经建立了一个专门的跨学科团队,希望利用AI推动基础研究的发展:召集来自结构生物学,物理学和机器学习领域的专家,应用前沿技术来预测基于蛋白质的3D结构仅根据其遗传序列。他们的系统AlphaFold建立在数十年来使用大型基因组数据集预测蛋白质结构的研究的基础上。 AlphaFold生成的蛋白质3D模型比以前的任何一种都要精确得多,这标志着生物学的一项核心挑战取得了重大进展。 来源:deepmind |报道链接

搜狗公司手机AR实景驾驶导航

传统导航定位,是以GPS为主,并使用陀螺仪、加速度计等传感器来提升精度。但在这种精度下,车道级定位目前在技术上是比较难以实现的。这也就是实际使用地图软件导航过程中,常常遇见的主辅路不分、转弯路口指示不清晰等问题出现的原因。不过,其实还有一种非常常见的传感器尚未得到充分利用,那就是摄像头。AR导航,实际上就是把视觉感知技术引入到地图导航之中。有了视觉这一重感知,结合AI技术,所见即所在成为可能,结合GPS导航,整个系统横向和纵向的定位能力都会得到提升,实现车道级识别。 来源:量子位 |报道链接

竞赛 2020 ASC超算竞赛启动

ASC世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)是由中国发起的世界最大规模的大学生超算竞赛,与美国SC、德国ISC并称全球三大超算竞赛,也是目前全球最大规模的大学生超算竞赛。作为ASC竞赛倡议方,中国自2012年举办比赛以来在超级计算的硬件投入和建设方面取得了相当大的进步,通过ASC大赛平台希望推动各国及地区间超算青年人才的交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。ASC超算竞赛每年超过1000名大学生报名参赛,参赛大学生需在近2个月的时间内熟悉预赛赛题的应用特点并交出优化思路,最终进入总决赛的为20支队伍100人。目前,多所海内外知名高校已报名参赛,所有参赛队将在接下来近两个月的初赛中展开激烈角逐。 来源:AI科技大本营 | 报道链接

经验 童欣:研究之味

微软亚洲研究院首席研究员童欣认为我们做计算机应用和工程研究的人,本质上离科学家稍远,倒是更接近匠人,也喜欢以工兵自称自嘲。在生活中他是个懒人和吃货,唯一一个爱好能和匠人相关的,是下厨做饭。回想他自己过去二十年做研究的经历,正如他做的饭菜一般,也是五味杂陈,一点感受写下来供大家哂之。 来源:微软研究院AI头条

陈梓瀚:我在微软“造轮子”

陈梓瀚Vczh,在网络上,大家可能熟悉他在知乎的外号——轮子哥。而在现实中,他的名字就印在久负盛名的C++经典教程《C++ Primer 第五版》的封面上,因为他是这本书的审校之一。他常年利用闲暇时间开发C++图形界面库GacUI。这是一款在架构上跨平台、支持控件与模板分离、灵活的数据绑定以及全面支持MVVM模式的C++ GUI库。如今,他在西雅图微软总部为Office开发基础组件库,也就是专业「造轮子」,无论工作还是闲暇,他都乐衷于此,知乎「轮子哥」的外号也是因此而来。本文将介绍他的编程成长经验。 来源:nycdatascience | 原始博文 | 中文博文

求职 吴恩达公司出品职业指南

Workera是一家deeplearning.ai公司,通过提供指导和优质工作机会,帮助数据科学家,机器学习工程师和软件工程师实现其职业目标。他们的目标是确保每个人,无论背景如何,都可以发挥最大的潜力并实现其在AI方面的职业目标。 来源:deeplearning.ai | PDF下载

AI公司HR/面试官讲解如何招机器学习工程师

Reddit上刚刚火了一个面试分享帖,有不少机器学习从业者或者招人的技术Leader、HR们,都在这里分享了他们亲身经历过的面试机器学习技术人员的方式。从这里,你可以看到一些或长或短的面试流程,或刁钻或简洁的问题;还能从HR和招人的技术Leader的角度,知道有些面试你是怎么挂掉的。本文从中总结出了机器学习面试的四大套路。 来源:Reddit | 原始报道 | 中文报道

以上是《智源社区AI周刊》第6期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请不吝赐教发至:editor@baai.ac.cn。谢谢大家。

特约编辑:刘布楼 常政 刘沂喆

内容中包含的图片若涉及版权问题,请及时与我们联系删除