智源社区AI周刊#75：2021全球Top 1000计算机科学家h指数发布

导读

为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯，智源研究院编辑团队本周整理了第75期《智源社区AI周刊》，从学术（论文和新思想、学术会议等），行业和政策（技术产业政策、项目基金申请、技术投融资等），人物（学者的人事变动和获奖情况）、数据（数据集），工具（新工具和应用推荐）等诸多角度，鸟瞰过去一周人工智能领域值得关注的动态。

过去一周（2021/05/24~2021/05/30），值得关注的内容有以下3方面：

一、近日， Guide2Research网站 2021 全球Top 1000 计算机科学和电子领域顶尖科学家名单最新出炉了！其中有14位顶尖科学家获得了计算机科学领域最负盛名的图灵奖，273名科学家是ACM Fellow，401名科学家是IEEE Fellow。这份名单旨在让学术界的学者了解计算机科学最前沿的学者所做出的有影响力的研究贡献，且它希望能激励世界各地的研究人员、决策者和企业家们，找出顶尖专家的研究发展方向。（详情参见本周报“人物”栏目）

二、近日，中国工程院院士、国家制造强国建设战略咨询委员会主任周济，在天津召开的第五届世界智能大会上，发表了题为《智能制造是第四次工业革命的核心技术》的主题演讲。报告全景展现了目前我国人工智能和智能制造领域的创新成果。主要分几部分：一、智能制造是推进制造强国战略的主要技术路线进入新时代；二、智能制造是第四次工业革命的核心技术；三、抓住机遇，乘势而上，实现中国制造业的跨越发展。（详情参见本周报“观点”栏目）

三、就在近日，TensorFlow 开源了 TensorFlow 决策森林 (TF-DF)。TF-DF 是用于训练、服务和解释决策森林模型（包括随机森林和梯度增强树）生产方面的 SOTA 算法集合。现在，你可以使用这些模型进行分类、回归和排序任务，具有 TensorFlow 和 Keras 的灵活性和可组合性。（详情参见本周报“新工具”栏目）

下面是各个要点的详情介绍。

论文推荐

Amazon Web Services | SiamMOT：Siamese多目标追踪

SiamMOT: Siamese Multi-Object Tracking

本文专注于改进在线多目标追踪(MOT)，提出一种基于区域的Siamese多目标追踪网络SiamMOT，同时检测和关联目标实例。SiamMOT包括一个运动模型，用于估计实例在两帧间的运动，从而使检测到的实例具有关联性。为探索运动模型如何影响其追踪能力，提出两种Siamese追踪器的变体，隐式运动模型和显式运动模型。在三个不同的MOT数据集上进行了广泛的定量实验，分别是MOT17、TAO-person和Caltech Roadside Pedestrians，显示了运动建模对MOT的重要性，以及SiamMOT大幅超越最先进水平的能力。SiamMOT在HiEve数据集上的表现也超过了ACM MM'20 HiEve Grand Challenge的优胜者。SiamMOT是高效的，在单个现代GPU上以17 FPS运行720P视频。

查看详情及论文下载

腾讯&北理工 | 读、听、看：利用多模态信息帮助中文拼写检查

Read, Listen, and See: Leveraging Multimodal Information Helps Chinese Spell Checking

中文拼写检查（CSC）的目的是检测和纠正用户生成的中文文本中的错误字符。大多数的中文拼写错误都是在语义、语音或图形上被误用的相似字符。以前的工作注意到了这一现象，并尝试将相似性用于此任务。但是，这些方法使用启发式或手工制作的混淆集来预测正确的字符。本文提出了一种直接利用汉字多模态信息的汉字拼写检查器REALISE模型。该模型处理CSC任务的方法是：（1）捕获输入字符的语义、语音和图形信息；（2）有选择地混合这些模式中的信息以预测正确的输出。在SIGHAN基准上的实验表明，该模型的性能明显优于强基线。

查看详情及论文下载

三星研究院 | 基于稀疏监督的移动端实时单目深度估计

Real-time Monocular Depth Estimation with Sparse Supervision on Mobile

对于诸如自动驾驶，增强现实和图像编辑等各种应用，单目（相对或度量）深度估计是一项关键任务。近年来，随着移动设备的可用性不断提高，准确且对移动设备友好的深度模型变得越来越重要。越来越精确的模型通常需要更多的计算资源，这阻碍了此类模型在移动设备上的使用。移动用例可以说是最不受限制的用例，它需要高度准确但对移动友好的体系结构。因此，我们尝试回答以下问题：如何在不增加进一步复杂性（即参数）的情况下改进模型？为此，我们从各个维度系统地探索了相对深度估算模型的设计空间，并且我们展示了通过关键的设计选择和消融研究，即使是现有的体系结构也可以达到与现有技术相比极高的竞争性能。我们的研究涵盖了深入的主干模型选择过程，知识蒸馏，中间预测，模型剪枝和损失重新平衡。我们展示了仅使用DIW作为监控数据集的模型，该模型在具有2.6M参数的DIW上实现了0.1156 WHDR，在移动GPU上达到了37 FPS，而没有进行剪枝或特定于硬件的优化。我们模型的修剪版本在具有1M参数的DIW上达到0.1208 WHDR，在移动GPU上达到44 FPS。

查看详情及论文下载

人物交互检测 | ST-HOI：视频中人与目标交互检测的时空基线

ST-HOI: A Spatial-Temporal Baseline for Human-Object Interaction Detection in Videos

ST-HOI利用人和物体的运动轨迹、正确定位的视觉特征和时空掩码姿态特征等时间信息，显式添加在人物交互检测过程中，为视频人物交互检测提供一个新的时空感知基线。ST-HOI采用了一段视频作为框架，以3D-CNN为主干提取整个片段的时空特征图，为了纠正由时间RoI池引起的不匹配，基于物体轨迹生成时间感知特征，包括正确定位特征和时空掩码姿态特征，然后将这些特征与轨迹通过线性层连接和分类，最后为ideoHOI提供一个简单但有效的时间感知基线。

查看详情及论文下载

浙江大学 | 用于旋转目标检测的方向性RepPoint

Oriented RepPoints for Aerial Object Detection

与定向边界框相比，point set表示具有很大的潜力来捕获航空图像中具有任意方向，宽高比和密集分布的实例的详细结构。然而，传统的基于点集的方法是使用点对点监督在固定位置上手工制作的，这损害了它们在细粒度特征提取上的灵活性。为了解决这些限制，在本文中，我们提出了一种新的航空目标检测方法，称为Oriented RepPoints。具体来说，我们提出采用一组自适应点来捕获任意定向物体的几何和空间信息，从而能够在空间和语义场景中自动将其自身布置在对象上。为了促进监督学习，提出了定向转换函数，以将自适应点集显式映射到定向包围盒中。此外，我们引入了一种有效的质量评估方法来选择要训练的点集样本，从而可以根据代表性项目在定向目标检测方面的潜力来选择代表性项目。此外，我们提出使用空间约束来惩罚真实边界框外部的离群点。除了关注重叠率的传统评估指标mAP之外，我们还提出了一种新的指标mAOE来测量方向精度，而该精度通常在先前有关定向目标检测的研究中被忽略。对三个广泛使用的数据集（包括DOTA，HRSC2016和UCAS-AOD）进行的实验表明，我们提出的方法是有效的。

查看详情及论文下载

观点

周济：智能制造是第四次工业革命的核心技术

近日，中国工程院院士、国家制造强国建设战略咨询委员会主任周济，在天津召开的第五届世界智能大会上，发表了题为《智能制造是第四次工业革命的核心技术》的主题演讲。报告全景展现了目前我国人工智能和智能制造领域的创新成果。主要分几部分：一、智能制造是推进制造强国战略的主要技术路线进入新时代；二、智能制造是第四次工业革命的核心技术；三、抓住机遇，乘势而上，实现中国制造业的跨越发展。

智源社区AI周刊#75：2021全球Top 1000计算机科学家h指数发布

评论列表

评论