- 简介二值神经网络(BNN)将全精度权重和激活转换为极端的1位对应物,使其特别适合部署在轻量级移动设备上。虽然二值神经网络通常被表述为一个约束优化问题,并在二值化空间中进行优化,但一般的神经网络则被表述为一个无约束优化问题,并在连续空间中进行优化。本文通过利用双曲几何框架来优化约束问题,引入了双曲二值神经网络(HBNN)。具体来说,我们使用黎曼指数映射将双曲空间中的约束问题转换为欧几里得空间中的无约束问题。另一方面,我们还提出了指数参数化聚类(EPC)方法,该方法与黎曼指数映射相比,基于微分同胚缩小了线段域。这种方法增加了权重翻转的概率,从而最大化BNN中的信息增益。在CIFAR10、CIFAR100和ImageNet分类数据集上,使用VGGsmall、ResNet18和ResNet34模型的实验结果表明,我们的HBNN性能优于现有最先进的方法。
-
- 图表
- 解决问题该论文试图解决二值神经网络(BNN)在优化过程中面临的约束问题,以提高其性能和信息增益。这是一个在BNN领域内持续存在的挑战,而通过引入双曲几何框架来解决这一问题是新颖的。
- 关键思路关键思路是利用双曲几何框架优化BNN中的约束问题。具体来说,论文提出了Hyperbolic Binary Neural Network (HBNN),通过Riemannian指数映射将双曲空间中的约束问题转换为欧几里得空间中的无约束问题。此外,还提出了Exponential Parametrization Cluster (EPC) 方法,通过基于微分同胚缩小段域来增加权重翻转的概率,从而最大化信息增益。相比现有研究,这种方法在处理BNN的约束优化问题上提供了新的视角和技术手段。
- 其它亮点该论文在CIFAR10、CIFAR100和ImageNet分类数据集上进行了实验,使用了VGGsmall、ResNet18和ResNet34模型,并展示了HBNN在这些任务上的优越性能。此外,EPC方法显著提高了权重翻转的概率,进而增强了模型的信息增益。虽然文中未提及开源代码,但提出的创新方法为未来的研究提供了新的方向,尤其是在如何进一步改进BNN的性能方面。
- 最近在这个领域内的相关研究包括: 1. 'Bi-Real Net: Enhancing the Performance of 1-bit CNNs With Improved Representational Capability and Advanced Training Method'。 2. 'XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks'。 3. 'DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients'。 这些研究主要集中在改进BNN的训练方法和表征能力,而HBNN则通过引入双曲几何提供了一个全新的解决方案。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流