超越最新视频压缩标准H.266，字节跳动编码新技术让视频缩小13%

联合视频专家组 JVET 官网显示，字节跳动设立在美国的研发团队于今年初发起了一项视频压缩技术提案，并命名为 DAM（Deep-filtering with Adaptive Model-selection）。相比 H.266/VVC 最新标准，DAM 能够为视频编码性能带来显著提升，亮度信号 Y 可实现 10.28% 的性能增益。两个色度信号 U 和 V 的性能增益也分别达到 28.22% 和 27.97%。这是业界公开的单个智能编码工具的最佳性能增益。

今年初，字节跳动先进视频团队（AVG）向联合视频专家组 JVET 发起了一项 JVET-U0068 技术提案，可以为视频压缩的三个颜色分量（Y, U, V）分别实现约 10%、28%、28% 的性能增益，这是业界公开的单个智能编码工具的最佳性能增益。在优化压缩质量的同时，视频体积相比 H.266 最新标准至少还可以缩小 13%。就其实际效果而言，如果新技术得以应用，与现在主流的 H.264 标准相比，我们看同样质量的视频，大约只需要 22% 的带宽和存储空间。

这项技术名为 DAM（Deep-filtering with Adaptive Model-selection），它是通过深度学习技术构建减少视频压缩失真的滤波器，主干是基于残差单元堆叠的深度卷积神经网络，辅以自适应模型选择以最大程度适应特性复杂的自然视频。该技术由字节跳动 AVG 的美国加州研发团队实现，成员来自高通、英特尔、微软等巨头以及海内外多家顶级院校。

我们先从下图示例中对比 H.264 与 H.266+DAM 的视频压缩效果：

可以看到，相同压缩比条件下，H.266+DAM 编码压缩质量远远优于 H.264。除了视频压缩质量提升之外，应用 DAM 技术可以比H.266再缩小 13% 的数据体积，以下图片来自国际标准组织的测试视频。其中，图（左）为原图，每像素 12 字节；图（中）使用 VTM11.0 压缩（qp=42），每像素 0.00216字节，峰值信噪比 27.78dB；图（右）使用 VTM11.0+DAM（qp=42），每像素 0.00184 字节，峰值信噪比 28.02dB。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

超越最新视频压缩标准H.266，字节跳动编码新技术让视频缩小13%

评论列表

评论