汇聚每周AI观点、研究和各类资源,不错过真知灼见和重要资讯!欢迎点击这里,关注并订阅智源社区AI周刊。
编辑精选
在新一期长文中,牛津大学教授Michael Bronstein继续回顾几何深度学习的发展历程。新型几何类型的第一个神经网络架构,其灵感来自于神经科学。哈佛神经生理学家David Hubel 和 Torsten Wiesel揭示了负责模式识别的大脑部分的结构和功能——视觉皮层。
对视觉皮层结构的理解,对计算机视觉和模式识别的早期工作产生了深远的影响。日本广播公司的研究员Kunihiko Fukushima研发出一种新的神经网络架构,被命名为Neocognitron(新认知器),成为日后LeNet的基础。
新认知器已经具有现代深度学习架构的许多特征:深度、局部感受野、共享权重和池化。它甚至使用了ReLU激活函数。与现代系统的主要区别在于网络的训练方式:Neocognitron是一种以无监督方式训练的“自组织”架构,反向传播尚未在神经网络社区中广泛使用。
Fukushima的设计由当时的巴黎大学应届毕业生Yann LeCun做了进一步开发,LeNet放弃了更复杂的非线性滤波(抑制性连接),采用简单的线性滤波器,可以使用数字信号处理器 (DSP) 上的乘法和累加运算实现卷积。这样就进入了信号处理领域,将对深度学习的后续成功起到至关重要的作用。CNN 的另一个关键新颖之处是使用反向传播进行训练。
之后,由Krizhevsky、Sutskever和Hinton在多伦多大学开发的AlexNet成功击败了ImageNet上所有竞争方法。与其老兄弟LeNet-5相比,AlexNet在参数和层数方面明显更大,但在概念上是相同的。关键区别在于,它使用图形处理器 (GPU) 进行训练,是现在深度学习的主流硬件平台。CNN 在 ImageNet 上的成功成为深度学习的转折点,并预示着它在接下来的十年中被广泛接受。
在近日北京科学智能研究院(AISI)主办的AI for Science系列学术讲座上,诺贝尔化学奖得主Roald Hoffmann教授讲述了他对模拟(Simulation)和理解(Understanding)的见解。Hoffmann教授谈到了模拟和理解之间出现的拉锯:AI技术所代表数值模拟虽然高效,但也导致知识的解释难度越来越高,难以为人类带来理解上的提升。例如,在设计一种新材料结构的时候,所有算法预测出的构型都优于Hoffmann本人根据化学直觉提出的的结构。然而,尽管是电脑发现了能量更低的稳定结构,但是人类在研究中看到了结构和成键之间的联系。从这些例子来看,程序工作的核心不是为了得到解释,而是得到答案。
Hoffmann教授认为,在不远的将来,机器学习和神经网络等发展将在计算精度、效率、成本的方面会媲美目前最好的量子化学工具,使用大数据进行模拟有着势不可挡的发展前景。在AI的浪潮下,如何在这个时代保持人性?Hoffmann给出了让理解和模拟共存的方案:首先是让实验去引导人类,让实验作为团结一切的力量。其次要保持人性,去站到更高的维度思考事物之间的联系。再者,是多去“玩”可靠的工具,在不断使用过程中尝试建立对于工具工作方式的理解,进一步理解所研究的问题。同时,以“教”的心态去增进理解,不要以困难为借口就逃避解释。最后且最重要的是保持一颗好奇心,多问为什么。
在讲座的最后,Hoffmann回忆了曾经和Ed Wilson的一次访谈。Ed Wilson认为,如果人类和外星人产生交流,他们更感兴趣的也是人类的文化,而不是科技。文化是人类几千年用一种有创造力的艺术方式来积累的想象力和创造力的产品。这是人类的遗产,是使我们成为人的根基。
观点
- 鄂维南院士:AI for Science,一场发生在当下的科技革命
- DeepMind创始人Demis Hassabis:AI的强大,超乎我们想象
- Geofrey Hinton预测人工智能的下一个大事件:脉冲神经网络的学习算法
- 独家采访前OpenAI研究经理、UBC大学副教授Jeff Clune:智能源于自发产生而非计划
- IEEE Fellow王井东:我很看好Transformer
研究前沿
- 深度学习几乎已经可以完美预测大气冰晶的形成,论文登PNAS
- PNAS论文:Codex推开高等数学大门,小样本学习解决81%的数学问题
- 人工智能和可解释人工智能在空中交通管理中的应用综述
- 华为发布“国产Copilot内核”PanGu-Coder,支持中文指令
产业
- 2022世界人工智能大会SAIL奖Top30榜单发布,智谱华章、深势科技、瑞莱智慧等上榜
- 英矽智能完成新一轮融资,累计D轮融资9500万美元
- 智驾科技完成C1轮融资,此前2轮已融4.5亿元
- 拜登正式签署2800亿美元芯片法案,芯片股集体暴跌
科学家
新产品
- StabilityAI宣布开放Stable Diffusion模型申请:商用级别的文生图扩散模型
- 壁仞科技推出通用GPU芯片BR10,7nm工艺、16位浮点算力1000T以上
- 谷歌开源芯片计划发布90nm、130nm和180nm工艺设计套件
- 英伟达发布全套元宇宙虚拟人构建AI工具Omniverse Avatar Cloud Engine(ACE)
活动
- 报名 | 微软技术院士、微软Azure人工智能首席技术官黄学东:A Holistic Representation Toward Integrative AI(8月17日,清华大学智能产业研究院)
- 报名 | 斯隆研究奖、冯康科学计算奖得主,新加坡国立大学教授任维清:Long Feng Science Forum Seminar Series(8月15日,香港中文大学深圳SSE)
- 报名 | WAIC x SWITCH 2022国际AI线上论坛:AI向善,共塑可持续未来的AI(8月18日,AIII人工智能国际研究院)
- 报名 | 第十届全国社会媒体处理大会(8月19日,中国中文信息学会社会媒体处理专委会)
- 视频回放 | 2022智源大会开幕式及分论坛视频上线
- 视频回放 | 德州大学奥斯汀分校汪张扬:稀疏神经网络理论和实践
求职招聘
- 智源研究院 | AI for Science方向研究员,探索生命科学前沿,解决世界级科研问题
- 智源研究院 | 分子动力学方向研究员,研究生物大分子动力学模拟,实现分子结构功能的预测泛化
- 智源研究院 | 类脑智能方向研究员,追踪国际前沿文献,研发具有生理功能的大规模高精度神经网络模型
教程
- Kaggle所有竞赛开源方案和Top思路的汇总
- KDD2022《打击错误信息和应对媒体偏见》教程
- Hugging Face的Optimum组件适配加速Graphcore的IPU和英特尔Habana芯片教程
- 《几何深度学习》教程,牛津大学教授Michael Bronstein主讲
资料下载
查看预训练、强化学习等领域周刊内容,欢迎点击这里。
招聘、活动、推广等合作,请联系:editor@baai.ac.cn
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢