- 简介当前的现代人工智能系统虽展现出卓越的能力,却以巨大的能耗为代价。为将智能与物理效率相联系,我们在明确的核算规范下,提出了两个相互补充的“每焦耳比特数”(bits-per-joule)度量指标:(1)**热力学表征复杂度每焦耳**(Thermodynamic Epiplexity per Joule)——指在给定边界内,智能体内部状态中新编码的、关于某一理论环境实例变量的结构化信息量(以比特计),与该边界内实测能耗(单位为焦耳)之比;(2)**赋能能力每焦耳**(Empowerment per Joule)——指在固定时间步长(horizon)内,智能体具身感知—运动通道的容量(即控制信息量)与其预期能量消耗之比。这两个指标共同构成了“物理智能”的两个正交维度:**识别能力**(即建模能力)与**控制能力**(即对行为结果的影响力)。 借助随机热力学理论,我们证明:在明确子系统假设的前提下,一个基于朗道尔(Landauer)尺度的、用于表征复杂度获取的闭合循环基准值,可直接由标准的热力学学习不等式推导得出;同时,我们进一步阐明:在明确的“重置/复用”及“边界封闭”假设下,朗道尔尺度的能量成本本身即可作为此类闭合循环的基准参考。反之,我们给出一个简洁的解耦构造示例,表明:若缺乏上述假设,且不对穿越边界的外部低熵资源(例如新鲜内存)所隐含的成本进行计费,则信息增益与边界内部耗散之间未必存在紧密关联。 在实际应用场景中,当潜在的结构化变量不可观测时,我们将操作层面的“表征复杂度”概念与计算受限条件下的最小描述长度(MDL)表征复杂度相对齐,并建议将“MDL-表征复杂度”或“压缩增益”(compression-gain)等代理指标一并报告,作为其替代性度量。 最后,我们提出一个统一的能效评估框架:该框架要求同时报告上述两项指标,并辅以一份精简但关键的核查清单,涵盖边界与能量核算方式、粗粒化处理(coarse-graining)或噪声建模、时间步长(horizon)与重置机制,以及各项成本的约定;此举旨在显著降低指标定义的歧义性,支撑跨系统、可复现的“每焦耳比特数”比较。此外,我们还简要勾勒了该框架与经能量校正的规模化分析(energy-adjusted scaling analyses)之间的理论联系。
-
- 图表
- 解决问题现代AI系统虽能力强大,但能耗巨大;论文试图建立可比、物理可解释的‘智能效率’量化框架,解决当前AI能效评估缺乏统一热力学基础与明确边界约定的问题——这是一个新问题,首次将结构信息获取(epiplexity)与控制信息(empowerment)在能量约束下解耦为两个正交、可测量的bits-per-joule指标。
- 关键思路提出两个互补的热力学一致度量:(1) Thermodynamic Epiplexity per Joule(识别轴:单位能耗下在明确定义边界内新编码的环境结构信息比特数),(2) Empowerment per Joule(控制轴:单位预期能耗下的 embodied 传感器-执行器信道容量);关键新意在于显式建模子系统边界、重置协议与熵流,推导出Landauer尺度作为闭环基准的严格条件,并指出忽略边界重置/外部低熵资源输入时,信息增益与片上耗散可解耦——这纠正了‘信息必耗能’的常见误解。
- 其它亮点理论贡献为主,无传统实验或数据集;核心证明基于随机热力学与热力学学习不等式,给出Landauer闭环基准成立的充分条件(闭合边界+显式重置)及失效反例(decoupling construction);提出MDL-epiplexity作为不可观测潜变量下的操作替代指标;倡导统一报告清单(边界/粗粒化/时间范围/成本约定),并关联能量校准的缩放律分析;代码未开源,但框架具强可复现性;值得深入的方向包括:硬件级epiplexity实测基准建设、闭环强化学习中的empowerment-per-joule在线估计、以及MDL压缩增益与神经网络归纳偏置的定量关联。
- Thermodynamics of Computation (Bennett, Landauer); Stochastic Thermodynamics of Information Processing (Esposito, Parrondo); Empowerment as Intrinsic Motivation (Klyubin, Salge); Thermodynamic Bounds on Learning (Goldt, Seifert); Energy-Aware ML (Strubell et al., 'Energy and Policy Considerations for Deep Learning in NLP'; Schwartz et al., 'Green AI'); Minimum Description Length in Deep Learning (Hinton & Van Camp, 'Keeping the Neural Networks Simple').
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流