每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
Beyond Terabit/s Integrated Neuromorphic Photonic Processor for DSP-Free Optical Interconnects
2025年04月21日
生成式人工智能的快速扩展推动了对高性能计算的前所未见需求。训练大规模人工智能模型如今需要跨多个数据中心的庞大互联GPU集群。多尺度的人工智能训练与推理要求具备统一、超低延迟和高能效的连接,以使大量GPU能够作为一个整体单元协同工作。然而,传统的电学和光学互连技术依赖于传统数字信号处理器(DSP)来补偿信号失真,越来越难以满足这些严格的要求。 为了解决这些限制,我们提出了一种集成的神经形态光学信号处理器(OSP),该处理器利用深度储层计算技术,实现了无需DSP、全光学且实时的信号处理。实验表明,我们的OSP在C波段下通过5公里光纤实现了每通道100 Gbaud PAM4、总速率达1.6 Tbit/s的数据中心互连(相当于O波段下的超过80公里传输距离),远远超过了当前最先进的DSP解决方案的范围,而后者的性能从根本上受限于IMDD系统中的色散问题。同时,我们的OSP将处理延迟降低了四个数量级,并将能耗减少了三个数量级。与在高数据速率下引入更高延迟的传统DSP不同,我们的OSP无论数据速率如何扩展,都能保持一致的超低延迟,这使其非常适合未来的光学互连应用。 此外,OSP保留了完整的光场信息,从而实现更有效的损伤补偿,并能适应各种调制格式、数据速率和波长。通过成熟的硅光子工艺制造,OSP可以与硅光子收发器单片集成,进一步提升了全光互连的紧凑性和可靠性。这项研究提供了一种高度可扩展、节能且高速的解决方案,为下一代人工智能基础设施的发展铺平了道路。
271
热度
PDF
解读
Emergence and Evolution of Interpretable Concepts in Diffusion Models
2025年04月21日
扩散模型已成为文本到图像生成的首选方法,通过称为逆向扩散的过程从噪声中生成高质量图像。理解逆向扩散过程的动力学对于引导生成过程并实现高样本质量至关重要。然而,由于扩散模型的黑箱性质及其复杂、多步骤的生成过程,其内部运作机制在很大程度上仍然是个谜。机械可解释性(MI)技术,例如稀疏自编码器(SAEs),通过对其内部表示进行细致分析,旨在揭示模型的工作原理。这些 MI 技术已经在理解和引导大规模语言模型的行为方面取得了成功。然而,SAEs 的巨大潜力尚未被用于深入了解扩散模型复杂的生成过程。在这项工作中,我们利用 SAE 框架来研究一个流行的文本到图像扩散模型的内部运作,并在其激活中发现了多种可被人理解的概念。有趣的是,我们发现即使在第一个逆向扩散步骤完成之前,通过查看已激活概念的空间分布,就可以出人意料地准确预测场景的最终构图。此外,超越相关性分析,我们展示了所发现的概念对模型输出具有因果影响,并可以用来引导生成过程。我们设计了干预技术以操纵图像的构图和风格,并证明了以下几点:(1)在扩散的早期阶段,图像构图可以得到有效控制;(2)在扩散的中间阶段,图像构图已确定,但风格干预仍然有效;(3)在扩散的最后阶段,只有细微的纹理细节可以发生变化。
169
热度
PDF
解读