昨天,DeepMind 在博客中公布了一个好消息:他们的 MuZero 已经向现实世界迈出了第一步,展现出了在优化视频压缩质量方面的潜力。相关细节呈现在一篇预印版论文中。

论文链接:

https://storage.googleapis.com/deepmind-media/MuZero/MuZero%20with%20self-competition.pdf

在这项研究中,DeepMind 的研究者和 YouTube 展开了合作,一起探索 Muzero 在视频压缩领域的潜力。分析人士预测,流媒体视频将占据互联网流量的绝大部分。为了节省带宽,视频在传输之前就必须进行压缩。这样一来,如何将压缩后的视频画质、流畅度等损失降到最小就成了视频厂商关注的重要问题,也是一个有望用强化学习解决的问题。DeepMind 的 Muzero 可以在保证视频质量相似的前提下降低大约 4% 的比特率。

他们的首个研究对象是被 YouTube 和其他流媒体服务广泛使用的 VP9 编解码器(特别是开源版本 libvpx)。

对于 VP9 处理的每一帧视频,MuZero-RC 取代 VP9 的默认速率控制机制,决定应用的压缩级别,从而在较低的比特率下获得相似的质量。

DeepMind 为 Muzero 创建了一种名为「自我竞争(self-competition)」的机制,它通过比较智能体当前的性能和历史性能,将视频压缩的复杂目标转化为一个简单的 WIN/LOSS 信号。这使得一组丰富的编解码器需求转换成了一个简单的信号,再由智能体进行优化。

除了视频压缩,这项研究的意义还在于他们迈出了将 MuZero 应用于现实世界的第一步,证明了强化学习智能体可以用于解决现实世界的问题。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除