- 简介这本书是一本自包含的介绍现代(深度)神经网络设计的书籍。因为“神经”这个术语带有很多历史背景,所以作者更喜欢在文本中使用更简单的术语“可微模型”。这本250页的书的重点是构建处理$n$D数据的高效块,包括卷积、变换器、图层和现代循环模型(包括线性变换器和结构化状态空间模型)。由于这个领域正在快速发展,作者试图在理论和代码、历史考虑和最近趋势之间取得良好的平衡。作者假设读者对机器学习和线性代数有一定了解,但在必要时也会涵盖基础知识。 这本书是作者在Sapienza教授的名为“数据科学应用的神经网络”课程的讲义的精细草稿。作者没有涵盖许多高级主题(生成建模、可解释性、提示、代理),这些主题将随着时间的推移在伴随网站上发布。
- 图表
- 解决问题论文旨在介绍设计现代(深度)神经网络的基础,包括卷积、变换器、图层和现代循环模型等不同iable模型的有效处理块,以及如何处理nD数据。
- 关键思路论文提供了一种新的思路,即将神经网络称为可区分模型,并介绍了一些新的模型设计,如线性变换器和结构状态空间模型。
- 其它亮点论文的重点在于如何构建处理nD数据的高效块,同时在理论和代码、历史和现代趋势之间取得良好平衡。作者假设读者具有一定的机器学习和线性代数知识,并在必要时进行了相关介绍。论文还提供了一些实验结果,并使用了一些开源数据集。
- 在这个领域中,最近的相关研究包括生成建模、可解释性、提示和代理等高级主题,这些主题将在论文的配套网站上陆续发布。
沙发等你来抢
去评论
评论
沙发等你来抢