论文题目:用于隐式树结构表示的双曲神经网络容量界 Capacity Bounds for Hyperbolic Neural Network Representations of Latent Tree Structures 作者:Anastasis Kratsios, Ruiyang Hong, Haitz Sáez de Ocáriz Borde 机构:麦克马斯特大学数学系、牛津机器人研究所
本文研究了深度双曲神经网络(HNN)用于表示任意有限加权树的表示能力。首先,作者证明了任何多层感知机(MLP)都无法低失真地将大树嵌入低维欧式空间,与其深度、宽度或激活函数无关。具体而言,作者证明了任何嵌入树结构的MLP,其叶节点数大于欧式空间维数的二次方,其失真至少为叶节点数开d次根。与此形成对比的是,作者证明HNN可以将任意点云及其隐式树结构按任意精度地等距地嵌入双曲空间。此外,实现这种嵌入的HNN的深度、宽度和可训练参数数量与表示精度无关。实验结果证明了理论预测,即HNN优于MLP表示树结构。本文揭示了欧几里得空间与树结构之间的基本不兼容性,以及双曲空间的高效表示能力。
HNN最近在表示具有隐式层次结构的数据方面表现强劲,但主要依据的是直觉和经验。 本文通过数学分析证明了HNN表示树结构的优势,与此形成对比的是,作者证明了MLP表示大树结构必然产生失真。 本文的主要贡献是: 证明了MLP失真下界,与网络结构无关 证明HNN可以任意精度表示树结构,网络复杂度与精度无关 实验验证了上述理论预测
设,激活函数,是一个组合树,,叶节点数。
对任意MLP ,激活函数为,满足
其中与无关。则的失真至少为
常数项与的结构无关。
此结果表明,如果足够大,包含一个叶节点数为的树结构,是一个任意MLP,则对该树结构的表示失真至少为。也就是说,如果足够大,任意MLP都无法很好地表示该树结构,原因是欧几里得空间与树结构之间的几何结构不兼容,而非MLP结构的问题。
设,,。对任意点子集,任意度数至少为2的树结构。
存在曲率和HNN ,对任意满足
且定义的深度、宽度和可训练参数数量与无关,见表1。
该结果表明,HNN可以将任意大小的树以任意高精度嵌入双曲空间,且网络复杂度与精度无关。
在合成数据上比较了HNN和具有相同参数数量的MLP表示二叉树、三叉树和随机树的效果。 HNN在所有设置下都优于MLP,达到更低的MSE损失。 随着树规模的增大和嵌入空间维数的减小,HNN与MLP的性能差异更加明显。
证明了MLP表示大树结构存在难以逾越的下界,与网络结构无关。 证明了HNN可以任意精度表示树结构,网络复杂度与精度无关。 实验验证了HNN优于MLP表示树结构。 揭示了欧几里得空间与树结构之间的基本不兼容性。 证明了双曲空间表示树结构的高效性。 支持了HNN在表示层次结构数据方面的优越性。
内容中包含的图片若涉及版权问题,请及时与我们联系删除





评论
沙发等你来抢