Alice's Adventures in a Differentiable Wonderland -- Volume I, A Tour of the Land

2024年04月26日
  • 简介
    这本书是一本自包含的介绍现代(深度)神经网络设计的书籍。因为“神经”这个术语带有很多历史背景,所以作者更喜欢在文本中使用更简单的术语“可微模型”。这本250页的书的重点是构建处理$n$D数据的高效块,包括卷积、变换器、图层和现代循环模型(包括线性变换器和结构化状态空间模型)。由于这个领域正在快速发展,作者试图在理论和代码、历史考虑和最近趋势之间取得良好的平衡。作者假设读者对机器学习和线性代数有一定了解,但在必要时也会涵盖基础知识。 这本书是作者在Sapienza教授的名为“数据科学应用的神经网络”课程的讲义的精细草稿。作者没有涵盖许多高级主题(生成建模、可解释性、提示、代理),这些主题将随着时间的推移在伴随网站上发布。
  • 图表
  • 解决问题
    论文旨在介绍设计现代(深度)神经网络的基础,包括卷积、变换器、图层和现代循环模型等不同iable模型的有效处理块,以及如何处理nD数据。
  • 关键思路
    论文提供了一种新的思路,即将神经网络称为可区分模型,并介绍了一些新的模型设计,如线性变换器和结构状态空间模型。
  • 其它亮点
    论文的重点在于如何构建处理nD数据的高效块,同时在理论和代码、历史和现代趋势之间取得良好平衡。作者假设读者具有一定的机器学习和线性代数知识,并在必要时进行了相关介绍。论文还提供了一些实验结果,并使用了一些开源数据集。
  • 相关研究
    在这个领域中,最近的相关研究包括生成建模、可解释性、提示和代理等高级主题,这些主题将在论文的配套网站上陆续发布。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论