智源社区AI周刊#77：CVPR 2021公布最佳论文候选

导读

为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯，智源研究院编辑团队本周整理了第77期《智源社区AI周刊》，从学术（论文和新思想、学术会议等），行业和政策（技术产业政策、项目基金申请、技术投融资等），人物（学者的人事变动和获奖情况）、数据（数据集），工具（新工具和应用推荐）等诸多角度，鸟瞰过去一周人工智能领域值得关注的动态。

过去一周（2021/06/07~2021/06/13），值得关注的内容有以下3方面：

一、近日，CVPR 2021官方推特上公布了一个重要消息，即会议最重要奖项——最佳论文奖的候选名单，候选论文有32篇。在候选名单中，有华人参与的论文有18篇，作者来自国内外多所高校和研究机构。华人一作论文有16篇，包括陶大程、沈春华、何恺明等知名学者。以北京大学、香港大学、商汤研究院、浙江大学、武汉大学等国内机构学者为一作的论文有6篇。（详情参见本周报“会议”栏目）

二、此前，拜登在给总统科学顾问 Eric Lander 的一封公开信中提出了 5 大问题，在信中询问未来美国应该如何在科技领域确保领先地位，并探讨了中美从AI到合成生物学领域的竞争。日前，美国国家 AI 安全委员会主席 Robert Orton Work 针对 AI 和合成生物学在全球的重要影响力发表了评论。（详情参见本周报“观点”栏目）

三、哈尔滨工业大学社会计算与信息检索研究中心（哈工大SCIR）秦兵教授和刘铭教授近日发布了一个通用领域大规模条件性知识图谱数据集。本数据集源自于AG News文本分类语料，包含四个类别，2440 条数据，每条数据都是人工标注的条件知识图谱。该数据集的提出能够为条件性知识图谱的研究提供数据支持。（详情参见本周报“数据”栏目）

下面是各个要点的详情介绍。

论文推荐

微软|MusicBERT：符号音乐理解大规模预训练

MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training

象征性的音乐理解，指的是从符号数据中理解音乐（例如，MIDI 格式，但不是音频），涵盖了许多音乐应用程序，如流派分类、情感分类和乐曲匹配。虽然良好的音乐表征对这些应用有益，但缺乏训练数据阻碍了表征学习。受到自然语言处理中的预训练模型成功的启发，在本文中，我们开发了 MusicBERT，用于音乐理解的大规模预训练模型。为此，我们构建了一个包含超过100万首音乐歌曲的大型符号音乐语料库。自从象征性音乐包含更多的结构性（例如，条、位置）和各种信息（例如，速度、乐器和音高），只需采用 NLP 的预训练技术即可象征性的音乐只会带来边际收益。因此，我们设计了几种机制，包括 OctupleMIDI 编码和 bar-level掩蔽策略，以增强预训练符号音乐数据。实验证明了 MusicBERT 在四个方面的优势音乐理解任务，包括旋律完成，伴奏建议，流派分类，风格分类。消融研究还验证了我们在MusicBERT 中设计的 OctupleMIDI 编码和 barlevel 屏蔽策略。

查看详情及论文下载

鲁棒学习 | 引入对抗扰动的公平分类

Fair Classification with Adversarial Perturbations

本文在一个无所不知的对手存在的情况下研究公平分类，给定一个η，允许选择任意η-部分训练样本并任意扰乱其受保护的属性。动机来自受保护属性可能由于战略误报、恶意行为者或插补错误而引起的错误设置；在这种对抗性环境中，先前的方法对错误做出随机或独立假设的程度可能无法满足他们的准确性。本文的主要贡献是一个优化框架，用于在这种对抗性环境中学习公平分类器，并提供可证明的准确性和公平性保证。框架适用于多个和非二进制受保护属性，专为大类线性分数公平性度量而设计，并且还可以处理除受保护属性之外的扰动。实验证明了本文的框架对自然假设类的保证近乎严格：没有算法可以有明显更好的准确性，任何具有更好公平性的算法都必须具有较低的准确性。根据经验，本文还评估了框架生成的分类器，并用于对一系列对手的真实世界和合成数据集的统计率。

查看详情及论文下载

超图学习 | 用于超图学习的可学习超图拉普拉斯

Learnable Hypergraph Laplacian for Hypergraph Learning

超图卷积神经网络（HGCNN）在建立图结构数据中的高阶关系方面具有很大的潜力。然而，现有的卷积滤波器大多是由预先定义的初始超图拓扑定位并确定的，无法很好地发掘真实数据中的隐式和长程关系。在本文中，作者提出了第一种基于学习的自适应超图结构构造方法 HERALD，这是一种通用的即插即用模块，可以提高 HGCNN 的表征能力。具体而言，HERALD 以端到端的方式自适应地优化超节点和超边之间的邻接关系，从而学习针对于具体任务的超图。此外，HERALD 利用自注意机制来捕捉非局部配对节点的关系。

查看详情及论文下载

Transformer | CAT：视觉Transformer中的交叉注意力

CAT: Cross Attention in Vision Transformer

本文针对视觉Transformer中，用图像块替换单词标记所需的计算量非常大的问题，提出了视觉Transformer中的交叉注意力方法（CAT）。CAT在图像块内部交替注意来获取局部信息，在单通道特征图划分的图像块之间应用注意来获取全局信息，这两种操作的计算量都小于Transformer中的标准自我注意。通过交替应用注意内贴片和注意间贴片，实现了交叉注意力，以较低的计算成本保持性能，并为其他视觉任务构建了一个称为交叉注意力Transformer（CAT）的层次网络。

查看详情及论文下载

贝叶斯学习 | 用于贝叶斯优化的基于强化学习的小样本采集函数学习

Reinforced Few-Shot Acquisition Function Learning for Bayesian Optimization

贝叶斯优化 (BO) 通常依赖于手工采集函数 (AF) 来顺序确定样本点。然而，在实践中广泛观察到，在不同类型的黑盒函数下，在遗憾方面表现最好的 AF 可能会有很大差异。设计一种能够在各种黑匣子函数中获得最佳性能仍然是一个挑战。本文旨在通过强化少样本 AF 学习 (FSAF) 的角度来应对这一挑战。具体来说，作者首先将 AF 的概念与 Q 函数联系起来，并将深度 Q 网络 (DQN) 视为代理可微分 AF。虽然将 DQN 和现有的小样本学习方法相结合是一个自然的想法，但发现这种直接组合由于严重的过度拟合而表现不佳，这在 BO 中尤其重要，因为需要通用的采样策略。为了解决这个问题，本文提出了一个 DQN 的贝叶斯变体，它具有以下三个特征：（i）它基于 Kullback-Leibler 正则化框架学习 Q 网络的分布作为 AF。这本质上提供了 BO 采样所需的不确定性并减轻了过度拟合。 (ii) 对于贝叶斯 DQN 的先验，作者建议使用由现成 AF 诱导的演示策略，以获得更好的训练稳定性。 (iii) 在元级别，本文利用贝叶斯模型不可知元学习的元损失，它是所提出的 FSAF 的天然伴侣。此外，通过正确设计 Q 网络，FSAF 是通用的，因为它与输入域的维度和基数无关。通过广泛的实验，证明 FSAF 在各种合成和现实世界的测试函数上实现了与最先进的基准相当或更好的遗憾。

查看详情及论文下载

观点

美国AI安全委员会主席：AI和合成生物学让更多新材料的生产成为可能

此前，拜登在给总统科学顾问 Eric Lander 的一封公开信中提出了 5 大问题，在信中询问未来美国应该如何在科技领域确保领先地位，并探讨了中美从AI到合成生物学领域的竞争。日前，美国国家 AI 安全委员会主席 Robert Orton Work 针对 AI 和合成生物学在全球的重要影响力发表了评论。Robert Orton Work 在美国海军陆战队服务 27 年，退役以后开启政治生涯。他曾在2014 年至 2017 年担任美国国防部第 32 任副部长。2019 年至 2021 年，Work 与Eric Schmidt 一同担任美国国家人工智能安全委员会主席。

智源社区AI周刊#77：CVPR 2021公布最佳论文候选

评论列表

评论