VcLLM: Video Codecs are Secretly Tensor Codecs

2024年06月29日
  • 简介
    随着大型语言模型(LLMs)的参数规模不断扩大,对大内存占用和高通信带宽的需求已成为LLMs训练和推理的重要瓶颈。为了缓解这些瓶颈,提出了各种张量压缩技术来减少数据大小,从而减轻内存需求和通信压力。我们的研究发现,尽管视频编解码器最初是为压缩视频而设计的,但在压缩各种类型的张量时表现出了极高的效率。我们证明了视频编解码器可以成为通用的张量编解码器,在各种任务中实现最先进的压缩效率。我们进一步利用GPU上可用的硬件视频编解码模块,创建了一个框架,能够使用视频编解码器重新用作张量编解码器进行推理和训练。这大大降低了内存容量和通信带宽的要求,使消费级GPU能够训练和推理大型模型。
  • 作者讲解·1
  • 图表
  • 解决问题
    论文旨在解决大型语言模型训练和推断中的内存和通信压力问题,提出使用视频编解码器作为张量编解码器以减小数据大小。
  • 关键思路
    使用视频编解码器作为通用的张量编解码器,利用GPU上的硬件视频编解码模块,实现大型模型的训练和推断,减小内存容量和通信带宽的需求。
  • 其它亮点
    论文使用视频编解码器作为张量编解码器,展示了在各种任务中达到最先进的压缩效率。实验设计充分,使用了多个数据集,并开源了代码。该方法可以进一步探究和优化。
  • 相关研究
    近期的相关研究包括《Compressing Neural Networks with the Hashing Trick》和《DeepZip: Lossless Data Compression using Recurrent Neural Networks》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问