XPU時代創新者英特爾

11月11日,英特爾正式發佈其全新服務器GPU,即首款數據中心的獨顯產品,該服務器基於Xe LP微架構,專為高密度、低時延的安卓雲遊戲和流媒體服務而設計。同時,英特爾還宣布將於12月正式交付相應的軟件堆棧oneAPI Gold工具。

英特爾此次同時推出了全新服務器GPU和oneAPI軟件,意味着英特爾開始釋放XPU的強大實力。

XPU時代創新者英特爾

英特爾率先定義XPU時代

10年前,美國數據科學家舍恩伯格在《大數據時代》一書中對「大數據時代」作出系統闡釋。

10年後,互聯網、人工智能、雲計算的發展正飛速推動全球數據量的增長。國際數據公司IDC統計顯示,預計到2025年,全球數據量將比2016年的16.1 ZB(1 ZB=十萬億位元組)增加10倍,達到163 ZB。

儘管越來越多的數據讓現代人置身於信隱私泄露的恐慌之中,但不可否認的是,大數據正為硬件、軟件乃至服務等市場帶來前所未有的經濟增長。

中國通信院發佈的《大數據白皮書(2019)》顯示,預計到2020年,全球大數據硬件、軟件和服務的市場規模將分別達到150億美元、200億美元和210億美元。這意味着基於大數據,將產生一個全球範圍內價值560億美元的市場。

但在這之前需要解決一個關鍵問題,在單一芯片算力受限的情況下,如何更好地發揮海量數據的真正價值?

對於這一問題,英特爾早已給出了答案。2015年,英特爾就開始斥資167億美元收購當時全球第二大FPGA廠商Altera,此後,又接連收購主攻深度學習方向的Nervana Systems、計算視覺公司Movidius、自動駕駛視覺處理公司Mobileye和雲端AI推理芯片已經商用的Habana Labs。

英特爾成為業界唯一一家擁有全類別AI芯片的公司之後,緊接着吸納業界頂尖的芯片人才,並於2018年架構日提出製程、封裝、架構、存儲、互聯、安全、軟件的六大技術戰略。

2018年的架構日在英特爾歷史上具有劃時代的意義,XPU異構願景就誕生於此,即由標量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的SVMS架構,分別對應CPU、GPU、加速器和FPGA,可以進行多種異構組合。

這是英特爾首次、也是業界首次明確將單一架構之後的發展方向定義為XPU。

XPU時代創新者英特爾

英特爾數據中心XPU產品和解決方案副總裁Jeff McVeigh表示:「XPU戰略的提出,在於我們意識到需要不同類型的架構來服務於各種不同的工作負載,其中一些工作負載在本質上是標量的,另一些是向量、矩陣、空間等等。」

從Xe架構到獨立顯卡,實現XPU願景的重要一步

英特爾在XPU戰略上進展迅速,在其它芯片公司還處於大規模併購階段時,就已經基於其豐富的技術經驗推出了自有的首款面向數據中心的獨顯產品。

英特爾表示,這款GPU採用的是英特爾能效最高的圖形架構,英特爾Xe LP微架構,擁有低功耗、獨立片上系統(SoC)設計,並配備128比特管道和8GB專用板載低功耗DDR4顯存。

另外,如果將英特爾服務器GPU同英特爾至強可擴展處理器組合,服務提供商可以在不改變服務器數量的情況下,單獨擴展顯卡容量,得以在每個系統上支持更多流和訂閱用戶,並且同時實現較低的總體擁有成本(TCO)。

通過在新華三3/4長、全高的x16 PCIe 3.0擴展卡內封裝四個英特爾服務器GPU,即可在一個典型雙卡系統中支持超過100個安卓雲遊戲並發用戶。這一數量最高可擴展至160個並發用戶,實際數量取決於具體的遊戲和服務器配。

之所以說英特爾XPU戰略進展迅速,是因為其從2019年底發佈Xe架構到推出基於Xe架構的集成GPU和獨立GPU產品,以及用於數據中心獨顯產品,間隔時間不到一年,就兌現了產品交付計劃。

事實上,Xe架構作為一個基礎GPU架構,屬性靈活且擴展性強,能夠衍生出多種針對不同領域和場景的GPU產品。

在英特爾2020年架構日上,英特爾官方首次詳細介紹了可實現全擴展的Xe圖形架構。按照不同的應用場景分,可將Xe架構分成四個系列:Xe LP、Xe HP、Xe HPC和Xe HPG。

XPU時代創新者英特爾

Xe LP屬於低功耗系列,是針對PC和移動計算平台的最高效架構,最高配置EU單元多達96組,並具有新架構設計,包括異步計算、視圖實例化 (view instancing)、採樣器反饋(sampler feedback)、帶有AV1的更新版媒體引擎以及更新版顯示引擎等。TigerLake SoC里集成的GPU、英特爾銳炬 Xe MAX 獨立顯卡和此次發佈的面向數據中心的獨顯產品均採用這一架構。

作為首批使用英特爾首款數據中心獨顯產品的客戶之一,騰訊先游雲遊戲總經理方亮認為:「SG1的編碼能力非常強,它能夠提供一個高密度、低延遲、靈活多樣的視頻編碼能力,另外在我們所測試的產品中,英特爾SG1的性價比高,英特爾技術團隊的支持也非常給力。」

Xe HP屬於高性能系列,是業界首個多區塊(multi-tiled)、高度可擴展的高性能架構,可提供數據中心級、機架級媒體性能,GPU可擴展性和AI優化。目前處於同客戶共同測試的階段,Xe HP產品將於明年推出。

Xe HPC屬於高性能計算系列,可用於超級計算機。Xe HPG是一種為遊戲優化的微架構,將具有加速的光線跟蹤支持,Xe HPG產品預計將於2021年開始發貨。

天下大同oneAPI,實現XPU的「靈魂互通」

一般而言,基於底層硬件架構的不同,完成同一項開發往往需要開發者使用不同的代碼重寫一次,需要付出極大的人力成本和財力成本。如果將硬件層面XPU的實現比喻成一個語言互不相通的團隊,那麼要想更好地釋放團體的真正實力,還需要一台能夠降低隊員們溝通成本,甚至能夠實現「靈魂互通」的機器。

雖然從生物算法的角度,目前還沒有辦法實現意識和「靈魂」的交換和交流,計算機應用程序的跨平台優化也一直是業界難點,但對於XPU而言,英特爾已經開發出幫助XPU團隊釋放真正實力的工具,即英特爾軟件級oneAPI工具包。

英特爾官方表示,如果用上了oneAPI工具包,開發者就能夠訪問英特爾XPU的通用、開放且基於行業標準高的編程模型,釋放底層硬件性能的同時降低軟件開發和維護成本。

XPU時代創新者英特爾

同時,Jeff也告訴雷鋒網:「oneAPI能夠把人們熟悉的語言和庫上的代碼,比如所有目前已經在至強處理器上運行的代碼,無縫地遷移到GPU和其他的架構上。所以它確實有很多好處,比如代碼重用,能夠利用現有的庫等等。如果你已經熟悉了一些庫,比如TBB和其他來自英特爾的庫,我們把它們進行了擴展以支持多種架構。這樣已經使用過這些庫的開發者可以繼續做開源,支持GPU和其他XPU架構。」

「oneAPI讓你不必有兩種不同的配置,兩種不同的構建,但是能夠在設計點之間為完全相同的服務提供一些靈活性。」英特爾數據平台事業部副總裁,視覺基礎架構事業部和NPG戰略總經理LynnComp補充道。

oneAPI是英特爾在SuperComputing2019大會上首次提出且為實現統一、簡化的跨架構編程模型的一個願景,即不受限於單一廠商專用的代碼構建,且能實現源有代碼的集成。藉助oneAPI,開發者可以針對他們要解決的特定問題選擇最佳的加速器架構,且無需為此一個架構和平台再重寫軟件。

英特爾初次提出這一願景時,很多人認為其實現難度大,能夠完成的可能性幾乎為零。但今天英特爾卻如期交付了oneAPI開發者工具包,足以證明其軟件實力。

英特爾宣布,英特爾oneAPI工具包將於12月在本地和英特爾DevCould上免費提供,同時還將提供包括英特爾技術諮詢工程師全球支持的商業版本。英特爾還會將英特爾Parallel Studio XE和英特爾System Studio工具套件遷移到oneAPI產品中。

XPU時代創新者英特爾

值得一提的是,即便沒有使用英特爾的芯片,oneAPI也能包容和支持,具有實現「天下大同」的能力,擁有廣泛的生態系統,這也促使oneAPI得到更加廣泛的業界支持。近期,微軟Azure和谷歌的TensorFlow已經宣布支持oneAPI,眾多領先的研究機構、公司和大學也支持oneAPI。

雷鋒網小結

從收購FPGA公司到吸納圖形處理器頂尖人才,從發展單一架構到定義XPU時代,從Xe架構提出到如期交付產品,近些年英特爾一直在釋放大數據潛力的產業領域探索,如今成長為業界唯一一家能夠提供XPU芯片的全能性公司,且能為其應將提供相適配的軟件、應用程序和生態,英特爾在數據在數據中心擁有獨一無二的實力。

未來的英特爾,又會在實現XPU的路上取得什麼樣的成績呢?