每天 0 点更新数据,热度根据全网互动数计算
最热 · 今天
最新
A Mathematical Theory of Payment Channel Networks
2026年01月08日
我们提出了一种以可行财富分布多面体 $W_G$ 为核心的支付通道网络几何理论;流动性状态 $L_G$ 通过严格环流投影到 $W_G$ 上。一笔支付是否可行,取决于转账后的财富状态是否仍落在 $W_G$ 内。由此导出一个简洁的吞吐量定律:若 $ζ$ 表示链上结算带宽,$ρ$ 表示支付失败(不可行)的期望比例,则可持续的链下带宽满足 $S = ζ / ρ$。 可行性也可从割区间角度理解:对于任意节点子集 $S$,其总财富必须落在某个区间内,该区间的宽度等于割集容量 $C(δ(S))$。基于此观点,我们展示了多方通道(如币池或通道工厂)如何扩展 $W_G$。将一个 $k$ 方参与的通道建模为一条 $k$-一致超边,可使每个割集的容量在期望意义上增大,从而使 $W_G$ 随 $k$ 单调增长;对单个节点而言,其可访问财富的期望值随 $k/n$ 线性增长。 我们还分析了资金耗尽问题。在线性且不对称手续费的条件下,财富纤维内的成本最小化流会将循环流量推向边界,通常会导致除剩余生成森林以外的所有通道被逐渐耗尽。为此,我们提出三种缓解策略:(i)对每个方向设置对称手续费;(ii)采用凸性或分级手续费(虽能实现有效的流量控制,但若不披露流动性信息,则与源路由机制存在冲突);(iii)协调式再注资(在同一条财富纤维内选择最优环流进行调整)。 上述结果共同解释了为何传统的两方通道网络难以扩展,以及为何多方通道原语具有更高的资本效率,能够提供更高的预期支付带宽。同时,这些结论也揭示了合理的手续费设计与协同管理如何帮助系统持续运行于可行区域内,从而提升支付网络的可靠性。
1682
热度
许愿开讲
PDF
解读
Learning About Learning: A Physics Path from Spin Glasses to Artificial Intelligence
2026年01月12日
霍普菲尔德模型最初受到自旋玻璃物理的启发,在统计力学、神经网络与现代人工智能的交叉领域中占据着核心地位。尽管该模型在概念上较为简单且应用广泛——从联想记忆到组合优化问题的近似最优解——却很少被纳入标准的本科物理课程体系。本文将霍普菲尔德模型呈现为一个具有丰富教学价值的框架,能够自然地整合本科阶段统计物理、动力系统、线性代数以及计算方法等核心主题。我们基于学生熟悉的物理概念,提供了简明且配有图示的理论导引,分析了模型的能量函数、动力学行为和模式稳定性,并讨论了仿真实践中的若干要点,包括一份可免费获取的模拟程序代码。为了支持课堂教学,我们最后还给出了若干可直接用于课堂的例题,其设计旨在贴近实际科研实践。通过明确建立基础物理学与当代人工智能应用之间的联系,本研究致力于帮助物理专业学生理解、运用并批判性地思考那些日益成为科研、工业与社会核心的计算工具。
282
热度
许愿开讲
PDF
解读
Demystifying the Slash Pattern in Attention: The Role of RoPE
2026年01月13日
大型语言模型(LLM)常常表现出“斜线注意力”模式,即注意力分数集中在某一位移量 $Δ$ 对应的第 $Δ$ 条次对角线上。这类模式在跨词元传递信息方面起着关键作用。但此类模式为何会出现?本文从实证和理论两个角度出发,揭示了这类“斜线主导注意力头”(SDH)的形成机制。首先,通过对开源大模型的分析,我们发现 SDH 是模型内在固有的特性,并且能够泛化到分布外的输入提示中。为解释这种内在性,我们深入研究了决定注意力分数的查询(queries)、键(keys)以及旋转位置编码(RoPE)。我们的实证分析揭示出 SDH 的两个典型特征条件:(1)查询与键几乎为秩一矩阵;(2)RoPE 主要由中高频成分主导。在这两个条件下,不同词元之间的查询与键几乎完全相同,而 RoPE 中中高频成分之间的相互作用则促成了 SDH 的形成。除了实证观察之外,我们在理论上进一步证明,只要满足上述条件(作为建模假设),就足以确保 SDH 的出现。具体而言,我们分析了在这些条件下配备 RoPE 的浅层 Transformer 的训练动态,并证明通过梯度下降训练的模型确实会呈现出 SDH,且这些 SDH 能够推广至分布外的输入提示。
256
热度
许愿开讲
PDF
解读
Dr. Zero: Self-Evolving Search Agents without Training Data
2026年01月11日
随着高质量数据日益难以获取,无数据的自我进化已成为一种颇具前景的新范式。该方法使大语言模型(LLM)能够自主生成并解决复杂问题,从而提升其推理能力。然而,多轮次的搜索智能体在无数据自我进化过程中面临挑战,主要受限于问题多样性的不足,以及多步推理和工具使用所带来的巨大计算开销。本研究提出了 Dr. Zero 框架,使搜索智能体能够在无需任何训练数据的情况下实现有效的自我进化。具体而言,我们设计了一个自我进化的反馈循环:由一个“提议者”生成多样化的问题,用于训练一个与提议者同源基础模型初始化的“求解器”。随着求解器不断进化,它反过来激励提议者生成难度逐步提升但依然可解的任务,从而建立起自动化的课程学习机制,持续优化两个智能体的性能。为提高训练效率,我们还提出了跳跃分组相对策略优化(HRPO)方法。该方法将结构相似的问题聚类,构建组级别的基线,有效减少了评估每个问题个体难度与可解性时所需的采样开销。因此,HRPO 在不牺牲性能与稳定性的前提下,显著降低了求解器训练过程中的计算需求。大量实验结果表明,完全无需数据的 Dr. Zero 框架在性能上达到甚至超过了全监督训练的搜索智能体,证明了复杂的推理与搜索能力完全可以仅通过自我进化而涌现。
246
热度
许愿开讲
PDF
解读
UniSH: Unifying Scene and Human Reconstruction in a Feed-Forward Pass
2026年01月03日
我们提出UniSH,一种用于联合度量尺度下三维场景与人体重建的统一前馈框架。该领域的一个关键挑战是缺乏大规模、带标注的真实世界数据,导致研究不得不依赖合成数据集。这种依赖带来了显著的仿真到真实(sim-to-real)域间差异,使得模型在野外视频上的泛化能力差、人体几何细节失真且对齐效果不佳。为解决这一问题,我们提出了一种创新的训练范式,能够有效利用未标注的野外真实数据。我们的框架融合了来自场景重建和人体网格恢复(HMR)的强而异构的先验知识,并通过两个核心组件进行训练:(1)一种鲁棒的知识蒸馏策略,通过从专家级深度模型中蒸馏高频细节来精细化人体表面;(2)一种两阶段监督方案,首先在合成数据上学习粗略定位,然后在真实数据上进行微调,直接优化SMPL网格与人体点云之间的几何对应关系。该方法使我们的前馈模型能够在单次前向传播中联合恢复高保真的场景几何结构、人体点云、相机参数以及一致的、具有度量尺度的SMPL人体。大量实验表明,我们的模型在以人体为中心的场景重建任务上达到了最先进水平,在全局人体运动估计方面也取得了极具竞争力的结果,优于现有的基于优化的框架和仅使用HMR的方法。项目主页:https://murphylmf.github.io/UniSH/
231
热度
许愿开讲
PDF
解读
AME-2: Agile and Generalized Legged Locomotion via Attention-Based Neural Map Encoding
2026年01月13日
在各种地形上实现敏捷且具有泛化能力的足式运动,需要感知与控制的高度融合,尤其是在存在遮挡和落足点稀疏的情况下。现有方法虽已在跑酷任务中展现出一定的运动敏捷性,但通常依赖端到端的感控一体化模型,其泛化能力和可解释性有限。相比之下,专注于提升泛化能力的方法往往敏捷性不足,且难以应对视觉遮挡问题。本文提出 AME-2,一种面向敏捷与泛化运动的统一强化学习(RL)框架,该框架在控制策略中引入了一种新颖的基于注意力机制的地图编码器。该编码器能够提取局部与全局地图特征,并利用注意力机制聚焦于显著区域,从而为基于强化学习的控制生成具备可解释性和泛化能力的状态嵌入。此外,我们还提出一种基于学习的地图构建流程,可快速生成对噪声和遮挡具有鲁棒性的、包含不确定性信息的地形表征,并作为策略的输入。该流程使用神经网络将深度观测转换为带有不确定性的局部高程图,并将其与里程计数据进行融合。同时,该流程还集成了并行仿真机制,使得控制器可以在在线建图条件下进行训练,有助于提升从仿真到现实的迁移效果。我们在四足和双足机器人上结合所提出的地图构建流程对 AME-2 进行了验证,实验结果表明,所得控制器在仿真和真实环境中均表现出优异的运动敏捷性,并能有效泛化至未见过的复杂地形。
228
热度
许愿开讲
PDF
解读
Tensor Logic: The Language of AI
2025年10月14日
人工智能的发展受到缺乏具备所有必要特性的编程语言的制约。PyTorch 和 TensorFlow 等库提供了自动微分和高效的 GPU 实现,但它们只是对 Python 的补充,而 Python 本身并非为人工智能设计。由于缺乏对自动化推理和知识获取的支持,人们不得不进行一系列漫长且代价高昂的修补式尝试来弥补这一缺陷。另一方面,LISP 和 Prolog 等人工智能语言则缺乏可扩展性和对学习的支持。本文提出了一种名为“张量逻辑”的新语言,它通过在基础层面统一神经网络与符号主义人工智能来解决上述问题。张量逻辑中唯一的构造是张量方程,其理论依据在于:逻辑规则与爱因斯坦求和本质上是同一类运算,其余一切均可归约为此。我展示了如何用张量逻辑优雅地实现神经网络、符号系统和统计方法中的关键形式,包括 Transformer 模型、形式化推理、核方法以及图模型。更重要的是,张量逻辑开辟了全新的研究方向,例如在嵌入空间中进行可靠的推理。这种方法结合了神经网络的可扩展性与可学习性,以及符号推理的可靠性与透明性,有望成为推动人工智能更广泛应用的基础。
194
热度
许愿开讲
PDF
解读
Applying Embedding-Based Retrieval to Airbnb Search
2026年01月11日
Airbnb搜索的目标是为房客匹配最符合其出行需求的理想住宿。这是一个颇具挑战性的问题,因为热门搜索地点通常有约十万套可入住的房源,而房客自身的偏好也千差万别。此外,诸如“灵活日期搜索”等新功能的推出,进一步大幅增加了每次搜索查询所匹配的合格房源数量。因此,亟需一个复杂的检索系统,能够以低延迟提供高质量的候选结果,并与整体排序体系无缝集成。 本文详细介绍了我们为Airbnb搜索构建高效且高质量检索系统的历程。我们阐述了在像Airbnb这样的双边市场中实施基于嵌入(Embedding-Based Retrieval, EBR)的检索系统时所面临的关键独特挑战,例如房源库存的动态变化、包含多个阶段的冗长用户转化漏斗,以及多样化的前端产品形态。我们还分享了在建模检索问题时的独特见解、如何构建稳健的评估体系,以及在线服务架构中的设计取舍。该EBR系统已上线生产环境,并支持多种应用场景,包括常规搜索、灵活日期搜索,以及用于营销活动的推广邮件。通过A/B测试,该系统在预订转化率等关键指标上均展现出统计学意义上的显著提升。
189
热度
许愿开讲
PDF
解读