2022-09-30日报：Make-A-Video：MetaAI发布“文-视频”生成新研究

【智源AI日报】每天速读5分钟，AI要事不错过！欢迎点击这里，关注并订阅智源AI日报。

资讯 | Make-A-Video：MetaAI发布“文-视频”生成新研究
看点：系统使用带有描述的图像来学习世界的模样以及通常的描述方式。它还使用无标签的视频来学习世界的运动方式。

资讯 | DreamFusion：Google发布“文-3D”生成新成果（使用2D Diffusion）
看点：主要工作原理是：给定一个标题，DreamFusion使用一个称为Imagen的文本到图像生成模型来优化一个三维场景。

人物 | 智源学术顾问Michael I. Jordan荣获世界顶尖科学家协会奖
看点：Michael I. Jordan教授是机器学习领域的先驱，通过在机器学习、概率学、统计学以及图模型这四者间建立联系，为机器学习奠定了数学与计算基础。

周刊 | 智源社区AI周刊No.100：李飞飞等最新文章：社会化人工智能；DreamFusion：Google发布“文本-3D”生成新成果
看点：汇聚每周AI观点、研究和各类资源，不错过真知灼见和重要资讯！

日报 | 爱可可AI前沿推介(9.30)
看点：无文本视觉-语言Transformer、深度神经网络低秩训练探索、Reward Hacking的定义和刻画、基于语言学的抗体语言形式化、几何复杂度的正则化器、有效且高效的检索增强文本生成、基于快速标签传播的大型网络社区检测、基于指令的文本改进基准、面向紧凑有效局部特征描述子计算的基于学习的降维

观点 | 大脑启发的AI模型：激活学习，挑战反向传播
看点：尽管反向传播非常高效，是目前人工智能成功的关键，但是相当一部分研究人员并不认为反向传播的学习方法同大脑的工作方式是一致的。

综述 | 自然：深度学习改变图像分析的五种方式
看点：深度学习算法有局限性，一系列快速增长的开源和基于 Web 的工具使入门变得比以往任何时候都更容易。

解读 | COLING 2022论文，中国地质大学、深圳大学、腾讯联合CSL-大规模中文科学文献数据集
看点：本文提出了 CSL-大规模中文科学文献数据集，包含约 40 万篇中文论文元数据（标题、摘要、关键词以及学科领域标签）。

论文 | 固定参数的模型有多大潜力？港中文、上海AI Lab等提出高效视频理解框架EVL
看点：通过固定骨干基础模型的权重，节省了训练计算量和内存消耗；同时通过利用多层次、细粒度的中间特征，尽可能保持了传统端到端微调的灵活性。

综述 | GNN与Transformer在CV中怎么用？香港大学最新《图神经网络和图Transformers在计算机视觉应用》综述
看点：本文从面向任务的角度对计算机视觉中的GNNs和图transformer进行了全面的回顾。具体而言，我们将其在计算机视觉中的应用根据输入数据的形式分为五类，即2D自然图像、视频、3D数据、视觉+语言和医学图像。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

2022-09-30日报：Make-A-Video：MetaAI发布“文-视频”生成新研究

评论列表

评论