從雲計算到低延時,傳統編碼器與創新技術雙劍合璧嚴把成本質量關
- 2019 年 10 月 4 日
- 筆記

當下無論是用戶、流量還是視頻分辨率都在不斷增長,相對於所需處理數據量較少且處理時間較充足的點播服務,對基礎架構所處理數據量要求更高且對延時控制更苛刻的實時視頻服務會為編解碼基礎服務器帶來巨大挑戰,對企業而言也意味着成本控制與盈利創收的壓力會越來越大。本文來自於賽靈思DCG數據中心的Sean Gardner在LiveVideoStackCon2019北京站上的精彩分享。
文 / Sean Gardner
整理 / LiveVideoStack
大家好,我是賽靈思DCG數據中心負責Video業務的Sean Gardner,本次演講的主要內容是賽靈思在中國發展過程中尋求新的業務探索與技術創新落地。
1. Xilinx應用領域與挑戰
賽靈思在各個領域都有着廣泛的應用,其中不乏許多創新,值得一提的是賽靈思在5G方面有着不錯的探索與實踐,特別是在基於雲的應用和對實時性非常敏感的應用兩個領域,其中最有代表性的分別是雲遊戲和對網絡延遲非常敏感的視頻會議系統(VSaaS)。

上圖強調了實時視頻、實時通信在所有市場里所佔據的重要地位,並且特別提到客戶的原創視頻和原創內容在其中所佔據的重要地位,客戶的這種需求會造成在基礎架構上存在挑戰和機遇。
而無論對於哪個細分領域,業界目前普遍面臨兩大挑戰:硬件成本和運營成本上的投入越來越高,這包括了運營的數據中心的硬件價格以及服務器價格都越來越昂貴。
2. 直播與點播行業現狀與挑戰
從市場調研結果可以發現,直播和點播兩大應用在未來都會面臨很大幅度的增長,其中市場預測直播業務對於CDN的需求將在2021年達到700億美元,並有可能在2023年超過點播業務。

其中,從下圖可以看到移動端視頻直播將會佔據越來越大的市場,而中國更將會成為移動端視頻中最大的市場。

除了急速增長的中國市場,美國在直播和點播方面有兩大典型應用:NETFLIX和Twitch。NETFLIX主要是文件類型的點播服務,實際應用場景中處理的文件流量要遠遠小於直播里的內容,並且點播服務可以有足夠的時間來處理視頻文件。Twitch主要提供遊戲直播服務,在服務器方面,基礎架構要處理更大量的流量視頻,達到實時甚至毫秒級的處理,這對服務器提出的挑戰更大,各方面所需要的成本也會更高。

上圖的曲線主要給出了峰值帶寬、峰值流量和平均流量上存在巨大差異,賽靈思面對這種差異會提供對服務器更有效的管理和解決方案。

上表中除了Bandwidth % of Revenue是根據一定的數據計算出來的以外,其它都是公有的、比較客觀的數據,之前說到服務器和帶寬成本變得非常昂貴,從這個表格中也可以看出,尤其是實時視頻流量帶來的成本為什麼在急劇的上升。

帶寬使用存在兩大挑戰:OPEX和CAPEX。以兩個極端舉例,Ninja同時有60萬人觀看的時候帶寬非常高,相比之下Alfred只有4個觀看者。這裡提到的80/20法則是指20%在視頻流佔據了80%的網絡流量,另外80%的視頻流佔據了20%的網絡流量。

用Twitch公開的數據來表明80/20法則:13%的視頻流佔據了74%的網絡流量
除了帶寬成本的增加,所有基礎設施的成本越來越高,下圖中紅色的曲線代表成本的增長,另外一條黃綠色的曲線代表的是ARPU,可以看到盈利變得平緩,這也帶來了另一個挑戰——如何做到盈利。

此外,之前提到用戶和流量在增長的情況,下圖則說明了在此期間視頻的分辨率也在不斷增長到8K甚至更高。與此同時,視頻的編碼器變得越來越複雜,編碼標準有很多的工具碼,從H.264到H.265,再到HEVC/VP9、AV1,編碼工具因此也變得越來越複雜,這些都會對基礎設施服務器帶來巨大的挑戰。

3. DCG視頻軟IP策略高VQ(視頻質量)/低比特率策略

賽靈思現在有兩條主要的業務,根據前面的總結,左邊是在非常傳統的FPGA基礎上發展軟件業務,右邊是發展新的硬件業務。從上圖可以看到左邊佔據了大量網絡流量,觀看人數特別多;而右邊則佔據了很多的視頻流,比如安防視頻的流量很大,但是觀看的人數卻沒有多少。賽靈思會針對這兩種不同的場景提供不同的解決方案:eSports和SafeCity是兩個完全不同的視頻場景,所以我們會根據它們的不同點給予兩種完全不同的解決方案——一邊是高質量,一邊是高密度。
OPEX需要基於傳統硬件開發軟件方案,比如英特爾的解決方案。在基於傳統硬件的軟件方案中,需要在質量與速度之間二選一。右邊的黃線若想有實時的視頻速度必定會以視頻質量作為犧牲。

與之相比,賽靈思在硬件的基礎上又加入了Soft IP,質量可以跟比較好的視頻編碼器比較。與此同時,由於採取了底層的硬件方案,速度也要遠遠超出軟件方案。

在相同的PSNR下進行Xilinx和x265比特率比較

相同質量下視頻編碼速率對比
以虎牙直播為例,虎牙直播每個季度的帶寬成本增長66.8%,一個季度帶寬成本是2500萬美元。賽靈思可以在同樣質量的情況下節省40%的碼率,也就是40%的帶寬,每季度2500萬美元的帶寬成本如果能夠節省30%或者40%就意味着一年就可以在帶寬方面節省2100萬以上的成本。

為了達到用戶帶寬節省,賽靈思自己以及整個合作方的生態里提供了各個視頻和圖片轉碼的工具,包括不同的編碼標準、編碼格式,不同的容器格式。

Xilinx生態為帶寬節省服務提供各種工具
值得一提的是,賽靈思還創造性的把FFmpeg集成在賽靈思的FPGA上,只要熟悉FFmpeg,就不需要對底層的FPGA有很高的理解程度。而前面提到的FFmpeg都是最標準的,並不是賽靈思自己的FFmpeg版本,所有的命令行都一樣,區別只在其中有一個option。

4. 視頻創新解決方案
4.1 Socionext將Xilinx FPGA用於下一代解決方案
Socionext在XILINX ALVEO卡上開發了一款質量非常高的H.264編碼器,並對編碼器做了包括主觀和客觀在內的測試。下圖是測試結果,客觀的質量評估里包括VMAF和PSNR,圖中所有紅線所顯示的數據都是SocionextH.264 Encoder編碼器性能,可以明顯看到在各項數據中都明顯優於x264 Enc. Very Slow setting。

Socionext H.264 Enc.與 x264 Enc. Very Slow setting對比
除了PSNR和VMAF等客觀評價,FPGA H.264在主觀評價上也有明顯優勢 ,從下圖對比中可以看到賽靈思基於FPGA的H.264編碼器有更豐富的細節, 在主觀質量上有明顯的的主觀優勢。

FPGA H.264 Enc 與 Nvidia T4 H.264 Enc 對比
4.2 V-Nova編碼器編碼效率

另外一款在賽靈思FPGA上的IP是V-Nova的編碼器,目前V-Nova編碼器的分辨率可以達到1080P,並且從編碼效率來看,它對1080P的視頻可以將碼率壓縮到950K,這在很多帶寬環境都不太理想的國家或地區是一件令人興奮的事情。
4.3 Xilinx在未來還有很大的上升空間

由於FPGA是可編程的,所以不管是在密度還是在視頻質量方面都有很大的提升空間。需要特別注意的是,不論OPEX還是CAPEX,不論是高密度還是高質量,都是基於相同的FPGA加速框架,用戶接口完全相同。

最後,賽靈思在自己和整個生態圈的合作方共同來打造應用不同場景的兩個不同方案,同時推出硬件的解決方案以及在硬件上的軟件系統。
