- 简介如今的深度学习方法关注于如何设计最合适的目标函数,以使模型的预测结果尽可能接近真实情况。同时,必须设计一种合适的架构来促进足够的信息获取以进行预测。现有方法忽略了这样一个事实,即当输入数据经过逐层特征提取和空间转换时,将会丢失大量信息。本文将深入探讨数据在通过深度网络传输时的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络为实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息,以计算目标函数,从而获得可靠的梯度信息来更新网络权重。此外,我们还设计了一种基于梯度路径规划的新型轻量级网络架构——通用高效层聚合网络(GELAN)。GELAN的架构证实了PGI在轻量级模型上取得了优越的结果。我们在基于MS COCO数据集的目标检测上验证了所提出的GELAN和PGI。结果表明,GELAN仅使用传统的卷积运算符,就能实现比基于深度卷积的最先进方法更好的参数利用率。PGI可用于各种模型,从轻量级到大型。它可以用于获得完整信息,以便从头开始训练的模型比使用大型数据集预训练的最先进模型获得更好的结果,比较结果如图1所示。源代码位于:https://github.com/WongKinYiu/yolov9。
- 解决问题论文旨在解决深度学习网络中数据损失的问题,特别是信息瓶颈和可逆函数的问题。同时,提出了一种称为可编程梯度信息(PGI)的新概念,以应对深度学习网络中的多个目标。论文还提出了一种新的轻量级网络架构GELAN,以解决参数利用率问题。
- 关键思路论文的关键思路是通过可编程梯度信息(PGI)来解决深度学习网络中的信息损失问题,并且提出了一种新的轻量级网络架构GELAN,通过梯度路径规划来解决参数利用率问题。
- 其它亮点论文提出的PGI可以为目标任务提供完整的输入信息,从而获得可靠的梯度信息来更新网络权重。GELAN是一种新的轻量级网络架构,只使用传统的卷积算子就能实现比基于深度卷积的最新方法更好的参数利用率。该论文在MS COCO数据集上验证了GELAN和PGI的性能,并提供了源代码。
- 最近的相关研究包括YOLOv4和EfficientDet等目标检测算法的研究。
沙发等你来抢
去评论
评论
沙发等你来抢