Intel發布第三代可擴展至強:八路224核心、唯一數據中心AI CPU
今天,Intel正式發布了第三代至強可擴展處理器,代號「Cooper Lake」,頻率、核心數、記憶體等提升的同時,重點強化了DLBoost深度學習能力,是當今全球唯一內置AI的主流數據中心處理器。
Cooper Lake主要面向四路、八路市場,今年晚些時候還將有基於10nm Ice Lake的志強,針對單路、雙路市場,二者互補構成完整的第三代家族。
至於為何如此劃分,Intel給出的解釋是更多客戶希望在更多路系統上進行AI強化。
Cooper Lake仍然採用14nm製程製造,最多28核心56執行緒(八路就是最多224核心448執行緒),部分型號增加了核心數量,同時頻率更高,基準頻率提升至最高3.1GHz,單核睿頻加速最高則可達4.3GHz,三級快取最多38.5MB(每核心對應1.375MB),熱設計功耗150-250W。
記憶體支援六通道DDR4,最高頻率3200MHz,單路最多12條,並支援16Gb高密度顆粒,單路最大容量可達4.5TB,八路就是36TB,當然也支援Intel自家的Optane PMem傲騰可持續記憶體,而且配合發布了新的200系列。
技術方面,部分型號新增加了Intel Speed Select(SST)技術,包括STT Core Power(SST-CP)、SST Turbo Frequency(SST-TF),可優化處理資源,提升工作負載性能、提高資源利用率、優化平台TCO成本,同時支援Intel AVX-512指令集、VNNI/BFloat16深度學習加速指令集。
由於面向四路、八路系統,Cooper Lake都內置了六條UPI互連匯流排,最高傳輸率達10.4GT/s。
輸入輸出方面,處理器支援最多48條PCIe 3.0通道,搭配C620A系列晶片組(包括C621A、C627A、C629A)還可提供最多20條PCIe 3.0、10個USB 3.0、14個SATA 6Gbps,處理器與晶片組互連通道為DMI 3.0 x4。
Cooper Lake封裝介面自改成了新的Socket P+,又稱為LGA4189,未來的Ice Lake也是這一新介面,都不兼容現在的LGA3647平台。
AI無疑是這三代可擴展至強的最大特色,而且一直在飛速前進。
2017年的第一點支援AVX-512 FP32浮點格式,具備高精度優勢,得到了24項優化,金山雲、美的、南京大學、盈谷等中國科技企業、機構等都做了部署。
2018年的第二代加入了DLBoost INT8整數格式,44項優化,我們也看到了更多國產機構的名字:科大訊飛、上海交大、京東雲、雲創大數據、智芯原動、匯醫慧影、青雲QingCloud、東軟等等。
而在最新的第三代上,我們又迎來了新的BFloat16(簡稱BF16),專為AI運算、深度學習等應用而開發,一方面適當降低了精度(依然很接近FP32),從而提高能效,軟體應用也不需要太多調整,另一方面則大幅提升了AI性能,官方宣稱相比上代FP32訓練性能提升最多1.93倍、推理性能提升最多1.9倍。
目前,支援BF16的第三代至強可擴展處理器已經獲得了阿里雲、螞蟻金服、騰訊雲、海鑫科金、東軟等公司的支援,實測顯示各項性能提升少則54%,多則97%。
BF16標準還已經獲得Google、微軟、ARM及其他AI公司的廣泛採納,Intel至強則是x86陣營中第一家、也是唯一一家支援它的CPU處理器。
根據Intel官方數據,如果以至強E7 v4系列為基準,AI訓練性能方面,三代可擴展至強使用AVX-512的話提升幅度為82%,BF16加持的DLBoost則能帶來2.14倍的提升;AI推理性能方面,AVX-512隻能獲得1.04倍的提升,INT8可達到5.25倍,BF16則是2.66倍。
強大的生態支援從來都是Intel的無敵優勢,這次也不例外,在官方支援名單中可以看到一連串大名,其中既有諸多全球的科技企業、科研機構、軟體巨頭、高校,也不乏眾多中國互聯網和科技企業、高等院校、通訊運營商,甚至可以看到銀聯、韻達快遞。
Cooper Lake三代可擴展至強分為三個子系列,總計11款不同型號,編號都以H或者HL結尾,區別在於HL支援單路最多4.5TB記憶體,H的則是1.12TB。
最高端的至強鉑金8300系列有六款型號,分別是8380HL、8380H、8376HL、8376H、8354H、8353H,前四款28核心56執行緒,後兩款18核心36執行緒,熱設計功耗150250W,記憶體頻率最高3200MHz(每通道一條)或者2933MHz(每通道兩條),支援四路、八路擴展。
至強金牌6300系列有三款型號,分別是6348H、6328HL、6328H,前一款24核心48執行緒,後兩款16核心32執行緒,熱設計功耗都是165W,記憶體頻率最高2933MHz,僅支援四路。
至強金牌5300系列有兩款型號,分別是5320H、5318H,一個20核心40執行緒, 一個18核心36執行緒,熱設計功耗150W,記憶體頻率降至2666MHz,僅限四路,該系列RAS能力有所精簡。
其中,金牌6328HL、6328H、5320H、5318H四款支援SST技術。
Intel稱,對比五年前的老平台(應該是至強E7 v3?),三代可擴展至強的平均性能提升達90%,平均資料庫性能提升則可達98%。
如果客戶不知道該選擇哪款型號,Intel還根據實際應用做了針對性的推薦,比如主做AI訓練的,就選更多核心的8380H、8376H、8354H;如果是記憶體密集型應用,自然優先選更多核心還支援大記憶體的8380HL、8376H;如果主要用於虛擬機,則推薦6348H這種核心數、記憶體都最適中的;
影片會員活動匯總>>
愛奇藝影片會員限時優惠5折
優酷影片會員年卡5折購(99元)
騰訊影片會員年費99元/京東plus聯合年卡128元
芒果TV 13個月 98元(6.16-6.22)