AI对广播和OTT内容分发中视频压缩的改善

本文来自SMPTE2019的演讲,演讲者是来自harmonic的高级产品销售经理Jean-Louis Diascorn。演讲主题是AI技术对广播和OTT内容分发中视频压缩的改善。

Jean-LouisDiascorn主要介绍了三个视频编码的AI应用实例:动态编码模式(Dynamic Encoding Style, DES),动态分辨率编码(Dynamic Resolution Encoding, DRE)和动态帧率编码(Dynamic Frame Encoding, DFE)。

Jean-LouisDiascorn首先介绍了动态编码模式,并给出了AI模型的2个步骤:首先离线训练出编码模式的预测模型,然后将其部署到实时编码器中。经过测试,部署在一级卫星中,该模型平均可以节省20%的码率。当应用在OTT中时可以用于内容感知编码。

接着,Jean-Louis介绍了第二个应用实例:动态分辨率编码。动态分辨率编码的作用是,在静态场景中提高分辨率,以便能观看到更多的细节,在运动场景中则适当降低分辨率。然后Jean-Louis给出了动态分辨率编码的框架,训练模型产生一个动态分辨率的预测模型,再将其部署到实时编码器中。测试结果表明DRE可以节省CPU计算量并同时提高视频的质量。

然后,Jean-Louis介绍了第三个应用实例:动态帧率编码。模型架构相似,训练用于预测帧率的模型。结果表明使用动态帧率编码节省了大约30%的CPU计算量,在码率节省方面,比AVC节省了约10%,比HEVC节省了约5%。

最后,Jean-Louis提出可以将几个应用实例进行结合,以节省更多的码率。并给出了不同组合在码率节省,QoE等方面的表现。

附上演讲视频:

http://mpvideo.qpic.cn/0bf2riaaoaaageakvjmbpzpfbcwda6faabya.f10002.mp4?dis_k=f2a29c013df8e638f70246abd8696d78&dis_t=1585813682