AI對廣播和OTT內容分發中影片壓縮的改善
- 2020 年 4 月 2 日
- 筆記
本文來自SMPTE2019的演講,演講者是來自harmonic的高級產品銷售經理Jean-Louis Diascorn。演講主題是AI技術對廣播和OTT內容分發中影片壓縮的改善。
Jean-LouisDiascorn主要介紹了三個影片編碼的AI應用實例:動態編碼模式(Dynamic Encoding Style, DES),動態解析度編碼(Dynamic Resolution Encoding, DRE)和動態幀率編碼(Dynamic Frame Encoding, DFE)。
Jean-LouisDiascorn首先介紹了動態編碼模式,並給出了AI模型的2個步驟:首先離線訓練出編碼模式的預測模型,然後將其部署到實時編碼器中。經過測試,部署在一級衛星中,該模型平均可以節省20%的碼率。當應用在OTT中時可以用於內容感知編碼。
接著,Jean-Louis介紹了第二個應用實例:動態解析度編碼。動態解析度編碼的作用是,在靜態場景中提高解析度,以便能觀看到更多的細節,在運動場景中則適當降低解析度。然後Jean-Louis給出了動態解析度編碼的框架,訓練模型產生一個動態解析度的預測模型,再將其部署到實時編碼器中。測試結果表明DRE可以節省CPU計算量並同時提高影片的品質。
然後,Jean-Louis介紹了第三個應用實例:動態幀率編碼。模型架構相似,訓練用於預測幀率的模型。結果表明使用動態幀率編碼節省了大約30%的CPU計算量,在碼率節省方面,比AVC節省了約10%,比HEVC節省了約5%。
最後,Jean-Louis提出可以將幾個應用實例進行結合,以節省更多的碼率。並給出了不同組合在碼率節省,QoE等方面的表現。
附上演講影片:
http://mpvideo.qpic.cn/0bf2riaaoaaageakvjmbpzpfbcwda6faabya.f10002.mp4?dis_k=f2a29c013df8e638f70246abd8696d78&dis_t=1585813682