欧氏空间由于其直观的几何特性及简单有效的公式而被应用于几乎所有的深度学习模型。然而,近年来的研究发现,复杂结构数据(如社交网络、电商数据等)的建模精度往往会受到“平坦”的欧氏空间的制约,“弯曲”的曲率空间(如双曲空间和球形空间)由于具备更强的表征能力成为一种更佳的选择。

本文介绍的曲率学习框架(Curvature Learning Framework,以下简称 CurvLearn) 由阿里妈妈技术团队自研,旨在实现曲率空间下任意深度模型的训练与优化。基于 Tensorflow,CurvLearn 提供了丰富的流形实现,封装了完整的向量算子和高层 API,具备大规模分布式训练能力。目前该框架已在阿里广告关键业务场景落地,并取得了比欧氏空间更好的效果。

本文将对 CurvLearn 的相关背景、适用场景及实现逻辑做简要介绍。

CurvLearn 开源地址:

https://github.com/alibaba/Curvature-Learning-Framework

曲率学习是一个开源的基于 Tensorflow 的非欧深度学习框架。它实现了多种非欧流形、非欧算子和黎曼优化器,基于与 Tensorflow 相似的底层接口,用户可以便捷的将模型从欧氏空间迁移至非欧空间。曲率学习整体架构如下图所示,自下而上分别包含流形(Manifolds)、算子(Operations)、模型(Models)、优化器(Optimizers)及应用(Applications)五大模块:

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除