移動平台上的視頻主觀質量評價

  • 2019 年 10 月 7 日
  • 筆記

本文是來自MHV(Mile High Video)2019的演講,演講者來自於Twitter公司的Sebastiaan Van Leuven。本次演講主要講述如何評價移動端上播放視頻的用戶體驗。

Sebastiaan首先介紹了對視頻測試平均意見分數(Mean Opinion Score)的方法及其優缺點。第一種方法是絕對類別評級(Absolute Category Rating):向受試者隨即展示一段視頻,受試者直接在1到5的區間內打分,然後一直重複。這種辦法最簡單,易於操作,但測試結果不精確,非線性,在不同的測試組中結果不一致,而且測試往往需要大量的受試者。另一種方法是雙刺激MOS(Double Stimulus MOS):隨機選擇一段視頻,向受試者分別展示原視頻和損傷視頻,受試者直接在1到5的區間內打分,一直重複直至測試完成。這種方法結果一致性高於MOS,但測試結果同樣不精確,非線性,且需要大量打分者。

接下來Sebastiaan介紹了參照標度的設計(Referenced Scale Design),其目的是設計一個線性單調遞增的感知質量標度。他們對視頻集在不同分辨率和碼率下進行編碼,然後創建PSNR曲線的凸包,然後選取50個對數間隔的分數點,然後以這些點中間位置對應的碼率和分辨率重新對視頻進行編碼,得到最初參考視頻集。受試者對最初參考集中的視頻成對打分,使用梯度下降推斷相對感知質量,從感知質量軸中選擇50個線性間隔的樣本,在中間位置對新樣本進行編碼,以改善參考視頻集。

最後,Sebastiaan介紹了自適應成對比較(Adaptive Paired Comparison)。當我們有了質量呈線性分佈的參照視頻後,便可將其作為對照對某一視頻進行打分。首先隨機選取一個視頻,用粒子濾波算法從參照視頻中選擇一個,向受試者展示兩個視頻並詢問哪個視頻看起來更好,然後更新主觀質量的概率分佈。在對所有樣本打分後得到測試視頻相比於所有參考視頻的優劣情況,對以上數據進行邏輯回歸,具有50%概率的交點對應的參考視頻等級即為觀察到的質量水平。

附上演講視頻:

演講PPT全文