LADDER: An Efficient Framework for Video Frame Interpolation

简介

视频帧插值（VFI）是各种应用程序中至关重要的技术，例如慢动作生成、帧率转换、视频帧恢复等。本文介绍了一种高效的视频帧插值框架，旨在在效率和质量之间取得良好的平衡。我们的框架遵循一个通用的范例，包括一个流估计器和一个细化模块，并结合精心设计的组件。首先，我们在流估计器中采用了大卷积核的深度卷积，同时减少了参数并增强了接受域，以编码丰富的上下文并处理复杂的运动。其次，我们不同于常见的具有UNet结构（编码器-解码器结构）的细化模块设计，我们发现这种结构是冗余的，我们的仅解码器的细化模块直接从粗到细特征增强结果，提供了更高效的过程。此外，为了解决处理高清晰度帧的挑战，我们还在训练过程中引入了一种创新的高清晰度感知增强策略，从而在高清晰度图像上实现了一致的增强效果。我们在不同数据集（Vimeo90K、UCF101、Xiph和SNU-FILM）上进行了大量实验。结果表明，我们的方法在要求更少的FLOPs和参数的同时，达到了最先进的性能，实现了明显的改进，达到了更好的效率和质量平衡。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在介绍一种有效的视频帧插值框架，旨在在效率和质量之间取得良好的平衡。
关键思路

该论文提出了一种新颖的深度卷积方法和编码器-解码器结构来实现视频帧插值。
其它亮点

该论文采用了深度卷积和编码器-解码器结构来提高视频帧插值的效率和质量；该论文还提出了一种新颖的高清增强策略来处理高清图像；通过在多个数据集上进行广泛的实验，该论文证明了该方法在效率和质量方面均优于当前的其他方法。
相关研究

在这个领域中，最近还有一些相关研究，如“Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation”和“Enhanced Deep Residual Networks for Single Image Super-Resolution”等。

LADDER: An Efficient Framework for Video Frame Interpolation

提问交流

提问交流