标题:脸书、MIT|The Principles of Deep Learning Theory:An Effective Theory Approach to Understanding Neural Networks(深度学习理论的原理:理解神经网络的有效理论方法)
简介:在本书中,我们在所做的每一个选择中都力求采用教学法,将直觉置于形式之上。这并不意味着计算不完整或草率;恰恰相反,我们试图提供每个计算的完整细节——其中肯定有很多——并特别强调执行相关计算所需的工具。事实上,了解计算是如何完成的与了解计算结果一样重要,因此我们的教学重点往往是其中的细节。其次,我们保留了对我们自己的电脑笔记本隐私的实验确认。鉴于现代深度学习代码的简单性和计算的可用性,您可以轻松地自行验证任何公式。第三,我们主要关注深度学习社区在实践中使用的现实模型:我们想要研究深度神经网络。特别是,这意味着 (1) 将不会讨论单隐藏层网络的一些特殊结果,以及 (2) 神经网络的无限宽度限制——对应于零隐藏层网络——将仅作为起点进行介绍。所有这些理想化的模型最终都会受到干扰,直到它们对应于真实模型。然而,我们的兴趣坚定地集中在为从业者使用的工具和方法提供解释上,以努力阐明是什么让它们如此有效。
下载地址:https://arxiv.org/pdf/2106.10165.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢