英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

  • 2019 年 11 月 22 日
  • 資訊

在SC19大會上,54期TOP500超頻排行榜發布了,這一次TOP10的超頻相比6月份的沒有什麼變化,使用英特爾X86處理器的系統依然佔據90%以上的份額,性能最強的超頻峰值性能達到了20億億次。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

不過十億億次級別的超頻已經到了最後關頭了,中國、美國、歐盟及日本都在憋大招,爭相推出百億億次超頻,也就是E級超頻,其中英特爾負責建設的是美國能源部下屬阿貢國家實驗室的Aurora極光超頻。

E級超頻在人類歷史上還是首次,它的出現會大大加速人類研究科技的進步,因為E級超頻不僅性能10-20倍於現有的超頻,而且能效更高,其中極光的能效是當前超頻的6倍多,阿貢國家實驗室主任保羅·卡恩斯(PaulKearns)表示,“極光系統的構建為支援新一代AI,並通過結合高性能計算和AI來解決現實問題,比如改善極端天氣預報、加速醫療、繪製人類大腦圖譜、開發新材料以及加深了解宇宙等。”

對英特爾來說,極光超頻一方面要關注HPC高性能計算,一方面還要照顧到新興的AI人工智慧,這兩種要求對超頻系統的要求並不一樣,新一代百億億次超頻的挑戰很大,迫切需要多元化的計算。

應對異構計算英特爾提出六大技術支

為了迎接以數據為中心的時代,應對由人工智慧、網路變革、雲計算、數據中心等新資訊時代所帶來的多元化高性能計算需求,英特爾去年底宣布了全新的技術戰略——六大技術支柱,分別從製程和封裝、架構、記憶體和存儲、互連、安全、軟體這六大技術上滿足全新計算的要求。

繼今年4月新一代FPGA產品Agilex發布、6月台北電腦展10nmIceLake處理器發布、到日前進一步披露的“極光”(Aurora)超級電腦架構的更多詳情,英特爾六大技術支柱從多方位不斷驅動計算產業的創新,實現性能指數級增長。

英特爾中國研究院宋繼強之前提出過,計算需求無處不在,而且日益多樣化,CMOS縮放、3D製程技術、新架構、新功能等將繼續推動摩爾定律向前發展,但是任何單一因素都不可能再滿足多元化的未來計算需求,而基於六大技術支柱的指數級創新,將是英特爾進入未來10年乃至下一個50年的驅動力。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

英特爾以數據為中心的晶片產品組合和新發布的oneAPI計劃,為百億億次級計算奠定了基石。而極光超頻成了又一個英特爾六大技術支柱推動異構計算願景落地的典範。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

極光超頻使用了新一代的10nm至強CPU及全新開發的基於Xe架構的GPU“PonteVecchio”,還有EMIB、Foveros先進封裝技術,快取、記憶體也會利用到新一代一致性快取架構RamboCache及傲騰可持久記憶體(OptaneDC),連接多個系統單元的匯流排也是基於CXL的新一代技術。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

在整個極光超頻上,每個計算節點包括了兩顆英特爾10nm至強可擴展處理器(代號SapphireRapids)、六個PonteVecchio GPU,整體支援超過10PB記憶體、超過230PB存儲容量,並能通過CraySlingshot技術連接200多個機架的節點。

引領超異構計算英特爾基於全新Xe架構的GPU問世

英特爾開發的極光超頻不僅僅是面向HPC高性能計算的,同時AI人工智慧運算也是它的重點,要同時兼顧這兩種類型的計算,英特爾為此研發了全新的基於Xe架構的GPU,同時還首次應用了新一代的7nm製程,這是整個百億億次超頻的核心所在。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

根據英特爾所說,基於Xe架構的GPU是一個非常靈活、擴展性極強的統一架構,並針對性地劃分成多個微架構,從而可用於幾乎所有計算、圖形領域,包括百億億次高性能計算、深度學習與訓練、雲服務、多媒體編輯、工作站、遊戲、輕薄筆記型電腦、隨身設備等等。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

用於HPC及AI運算的高性能基於Xe架構的GPU,代號為“PonteVecchio”,專為高性能計算建模、模擬工作負載以及人工智慧訓練而設計,最多可擴展到1000個EU運算單元,而且每個單元都是全新設計的,FP64雙精度浮點計算能力是現在的40倍。

PonteVecchio將採用英特爾7nm製程進行製造,並將成為英特爾首款基於Xe架構的GPU,可為高性能計算和人工智慧工作負載進行優化。

此外,它還採用英特爾Foveros3D和嵌入式多晶片互連橋接(EMIB)創新封裝技術,以及多種其它技術,如HBM高頻寬存儲器、CXL互連技術以及其它專利技術,完美地融合了英特爾的六大技術。

作為異構計算的集大成者英特爾通過oneAPI統一、簡化異構編

在英特爾的六大技術支柱中,軟體是處於最上層的,它是跟全球數千萬開發者最密切的支柱,指的可不是某種應用軟體,而是英特爾全新的軟體開發策略——oneAPI,統一的跨架構編程模型。英特爾認為,對於全新硬體架構的每一個數量級的性能提升潛力,軟體能帶來兩個數量級的性能提升。對於開發者來說,擁有一套利用好英特爾晶片的通用工具集,對於獲得性能的指數級擴展至關重要。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

為什麼會有oneAPI?說起來也很簡單,英特爾不光是有X86CPU及剛剛推出的基於Xe架構的GPU,還有Mobileye自駕晶片、Movidius視覺計算晶片、AgilexFPGA晶片及Nervana神經網路晶片,可以說是當前異構計算的集大成者。

英特爾擁有了目前幾乎所有的計算晶片,可以給客戶提供各種類型的選擇,但是代價就是不同晶片各自為戰,導致不能通用,開發也比較分散,而oneAPI就是一個統一的、簡化的編程模型,旨在簡化跨多架構的開發過程(如CPU、GPU、FPGA、加速器)。

對開發者來說,oneAPI提供了一個通用、開放的編程體驗,讓開發者可以自由選擇架構,無需在性能上作出妥協,也大大降低了使用不同的程式碼庫、程式語言、編程工具和工作流程所帶來的複雜性。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地

英特爾在oneAPI上會採取開放、開源的策略,DPC++語言和庫等都向公眾開放使用,英特爾也鼓勵其它硬體廠商使用,而其它硬體廠商可以創建自己的oneAPI實現並基於此對特定硬體進行優化。

極光進入百億億次計算時代英特爾推動異構計算完美落地

英特爾的X86處理器佔據了全球超頻市場的絕大多數份額,但是英特爾並沒有止步於此,未來10年乃至50年中,要想滿足HPC高性能計算及AI人工智慧等多樣化的計算需求,人們需要擴展更多的異構運算,這是實現指數級增長的關鍵。

百億億次時代的異構運算挑戰很大,需要全新的CPU、GPU,也需要新的快取、記憶體、互聯匯流排,更需要幫助開發者簡化開發,跨平台、跨系統編程,所以英特爾在推出革命性的計算架構之後,同時也加強了軟體開發,oneAPI統一編程模型也是重中之重。

英特爾的美好願景在極光超頻上堪稱一個完美落地,這台超頻不僅是首屈一指的百億億次平台,也詮釋了英特爾的六大技術支柱理念——提供多樣化的標量、矢量、矩陣和空間架構組合,以先進位程技術進行設計,由顛覆性記憶體與存儲層次結構提供支援,通過先進封裝集成到系統中,使用光速互連進行超大規模部署,提供統一的軟體開發介面以及安全功能。我們也期待看到更多基於六大技術支柱打造的產品上市,引領產業更好地解決多元化高性能計算需求的挑戰。

英特爾在極光超頻上的實踐 堪稱異構計算的完美落地