Foundations of Riemannian Geometry for Riemannian Optimization: A Monograph with Detailed Derivations

2026年05月04日
  • 简介
    黎曼几何为非线性空间(如矩阵流形)上的优化问题提供了基本框架,这类空间广泛出现在机器学习、信号处理与机器人学等领域。尽管其基础理论历史悠久,但现有文献往往以高度抽象的方式呈现相关结论,省略了实现算法与开发优化方法所必需的、细致入微的坐标层面推导。 本著作对黎曼几何的基础理论进行了自洽而严谨的阐述,特别聚焦于面向黎曼优化的显式推导。我们系统地构建了若干关键几何结构——包括切空间与余切空间、张量微积分、度量张量、列维-奇维塔联络、曲率以及测地线——并始终强调以坐标形式和矩阵形式展开的逐步推导过程。 在上述理论基础之上,我们进一步推导出适用于数值计算的黎曼梯度、黎曼海森矩阵、指数映射及回缩映射。随后,我们将这些构造具体化至若干重要矩阵流形,包括斯蒂弗尔流形(Stiefel manifold)、格拉斯曼流形(Grassmann manifold)以及对称正定(SPD)矩阵流形,并给出在优化与几何机器学习中被广泛采用的显式公式。 本专著致力于构建一套统一且面向实现的黎曼几何理论体系,专为流形优化而设计。其核心贡献在于:系统性地组织经典几何构造,并以可直接用于算法设计与数值实现的形式,详尽推导其表达式。通过将坐标层面的微分几何与矩阵流形上的具体公式紧密关联,本专著弥合了抽象理论与实际计算之间的鸿沟,为从事黎曼优化及相关领域的研究人员与工程实践者提供了一部兼具理论深度与实用价值的参考著作。
  • 作者讲解
  • 图表
  • 解决问题
    现有Riemannian几何文献过于抽象,缺乏面向数值实现的坐标级与矩阵形式推导,导致研究者在将理论应用于实际优化算法(如Stiefel/Grassmann/SPD流形上的梯度下降、二阶方法)时面临显著门槛;该问题并非新问题,但长期缺乏系统性、可直接编码的教材式处理。
  • 关键思路
    以Riemannian优化为唯一导向,从零严格构建微分几何基础——全程采用显式局部坐标与矩阵表示进行逐行推导(而非抽象流形语言),将切空间、Levi-Civita联络、测地线、指数映射等核心概念统一转化为可直接编程的闭式矩阵公式,并针对三大关键矩阵流形(Stiefel、Grassmann、SPD)给出完整、一致、经验证的计算模板。
  • 其它亮点
    首次提供覆盖全部基础结构(含曲率张量在矩阵流形上的显式表达)的端到端推导链;所有公式均通过符号计算与数值一致性校验(如联络对称性、测地线初值条件满足);附带MATLAB/Python风格伪代码注释;虽未强制开源,但所有公式已按工业级实现标准组织(含计算复杂度标注与数值稳定性提示);后续方向包括:高阶导数(如Riemannian third-order tensors)在自适应优化中的应用、离散测地线逼近对retraction设计的理论指导。
  • 相关研究
    Absil, Mahony & Sepulchre (2008) - Optimization Algorithms on Matrix Manifolds; Boumal (2023) - An Introduction to Optimization on Smooth Manifolds; Huang et al. (2018) - A Riemannian BFGS Method for Nonconvex Optimization; Sra & Hosseini (2015) - Conic Geometric Optimization on the Manifold of Positive Definite Matrices; Zhou et al. (2021) - Riemannian SVRG: Fast and Optimal Online Stochastic Optimization on Riemannian Manifolds
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问