單核性能暴漲超50%!ARM的野心昭然若揭

低功耗處理器設計已經應用於超過1800億顆晶片的ARM,兩年前就開始探索邊緣、雲端及5G市場,並發布了Neoverse E系列處理器,ARM當時稱到2021年這一系列處理器每年要實現30%的性能提升。2019年,第一代Neoverse N1推出,性能提升60%,是2018年提出的目標的兩倍。

單核性能暴漲超50%!ARM的野心昭然若揭

本周,ARM再次更新Neoverse產品線,發布第二代N系列Neoverse N2以及全新的Neoverse V1平台。相比Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之餘,單執行緒性能提升了40%。同樣與Neoverse N1相比,Neoverse V1的單執行緒性能可提升超過50%。

單核性能暴漲超50%!ARM的野心昭然若揭

單核性能暴漲超50%!ARM的野心昭然若揭

ARM在高性能計算市場是要靠單核與x86的多核競爭嗎?

Neoverse CPU為何強調單核性能?

Neoverse系列發布兩年之後,已經擁有了E系列、N系列、V系列三大系列。Neoverse N系列同時考慮了性能、功率、面積(PPA),擅長可擴展;V系列旨在提供最佳性能,相對而言會消耗更多面積和功耗;E系列主要關注效率,在功耗和面積的縮減上進行優化。

單核性能暴漲超50%!ARM的野心昭然若揭

作為最新發布的產品系列,V系列更加追求性能,因此Neoverse V1是面向7nm和5nm設計,並且率先支援可伸縮矢量擴展(SVE ,Scalable Vector Extensions)。SVE可基於未知寬度向量單元的軟體編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。

同時,V1還支援PCIe 5.0連接、DDR5、HBM2e和CCIX 1.0,可實現插槽之間的晶片與封裝內小晶片之間的雙向一致性通訊。

單核性能暴漲超50%!ARM的野心昭然若揭

ARM基礎設施事業部高級副總裁兼總經理 Chris Bergey接受雷鋒網採訪時表示:「SVE在加速HPC高性能計算領域或者是機器學習工作方面表現高效,同時它對軟體開發者非常友好,不需要管矢量的位寬是多少。未來我們會把SVE技術運用到除N2和V1之外的一系列核上面。」

以ARM架構為基礎的日本富岳(Fugaku)超級電腦就使用了512位的SVE的技術,它不僅是全球最快的超頻,也是最新Green500榜單排名第四的超頻。

ARM本周發布的另一款新產品Neoverse N2面向5nm製程設計,支援PCIe 5.0和DDR5,通過支援用於高頻寬存儲器的HBM3以及用於結構的CCIX 2.0和CXL 2.0來進一步擴展。可支援從8核心,20W到192核心350W的設計,橫跨雲、智慧網卡(SmartNICs)、企業網路到功耗受限的邊緣設備的高可擴展性平台。

單核性能暴漲超50%!ARM的野心昭然若揭

Chris Bergey表示,關於新發布的V1和N2的更多細節會在之後公布。現在我們只知道V1和N2相比上一代N1的單核性能提升了超50%和40%。

為什麼Neoverse CPU如此強調單核性能?Chris Bergey解釋:「我們認為雲服務廠商會更傾向選擇單執行緒處理器核,因為接近度、安全性、多租戶等特性可以為他們帶來更好的經濟性,這也是我們的產品聚焦單執行緒技術的原因。當然,Neoverse E1也支援同步多執行緒(SMT)技術。」

他還給出了一張圖表,X軸代表晶片級性能,Y軸代表每執行緒性能,從圖表中可以看到,相比傳統的英特爾和AMD伺服器CPU,Neoverse的單核及晶片級性能都超過了市場上的產品。

單核性能暴漲超50%!ARM的野心昭然若揭

Neoverse每年30%的性能提升持續到2021年之後

ARM承諾,Neoverse系列CPU的性能每年會提升30%,這種提升會持續到2021年。Chris Bergey說:「這當然與ARM工程團隊的努力和投入是分不開的,我認為與軟體生態的逐漸成熟有更大的關係,例如很多雲原生的軟體現在可以比較無縫地運行在ARM架構上面。」

單核性能暴漲超50%!ARM的野心昭然若揭

ARM在手機CPU市場持續更新的架構與Neoverse性能的持續提升顯然有著密不可分的關係。Chris Bergey表示,「我們在Cortex的基礎上,針對基礎設施領域所要求的功能做了進一步的增添或提升,並且打造最合適超多核設備的功耗與性能,包括核之間的互聯等優化工作。」

也就是說,同一時期的Cortex和Neoverse產品之間存在相似之處。比如,Neoverse N1是和Cortex-A76是同期開發,這兩個微體系結構有很多相似之處。

Neoverse V1可以看作是Cortex-X1的同級設計,兩款旗艦CPU可能共享許多超大型內核結構。Cortex-X1是今年5月份發布的新品,同樣追求最大性能。

Neoverse N2有些特殊,因為它代表下一代Cortex-A的設計,也就是與Cortex-X1同期發布的A78的後續產品,這或許也是Neoverse N2的技術細節現在還不能公布的關鍵原因。為了更直觀的說明Cortex與Neoverse產品線之間的關係,外媒AnandTech製作的一張圖能夠幫助大家更好地理解。

單核性能暴漲超50%!ARM的野心昭然若揭

圖片來源:AnandTech

軟體生態方面,ARM關鍵的任務在於ARM的晶片級介面,這提供了設計系統層級解決方案的機會。ARM在CCIX與CXL投資,提供更好的互聯技術,可以提供可擴展性的交換網,支援大量的處理器核。

單核性能暴漲超50%!ARM的野心昭然若揭

另外,ARM Project Cassini是希望通過標準、平台安全性與參考實施,對軟體開發者友好,讓行業合作夥伴能夠在基於ARM的平台上部署裝機即用。

在對基礎設施的基礎軟體包括作業系統、虛擬機管理程式支援方面,Xen、KVM、Docker容器以及越來越多的Kubernetes已經陸續宣布支援ARM架構。許多初期由ARM推動的開源項目正在變得自主運轉,商用ISV應用程式也齊步演進。

ARM伺服器CPU「搶食」x86蛋糕最缺的是時間

但想要真正撼動x86在雲端CPU市場的地位,ARM還有很長的路要走。Chris Bergey對雷鋒網表示:「ARM在雲端市場最大的挑戰還是時間。我們看到很多數據中心的客戶對轉向ARM有巨大的興趣。但從ARM的IP到晶片設計,到最後能夠在數據中心部署,再到軟體生態系統的支援,仍需要一定的時間以及很多產業鏈合作夥伴一起努力。」

單核性能暴漲超50%!ARM的野心昭然若揭

當然,Neoverse是面向從個雲端到邊緣的市場。Chris Bergey也指出,ARM的機遇其實包括了雲原生軟體的支援,以及協助客戶通過訂製化的形式克服摩爾定律減速帶來的挑戰等。

雷鋒網(公眾號:雷鋒網)此前報道,亞馬遜、Marvell都已經將ARM架構應用於雲端,亞馬遜推出了ARM架構的伺服器處理器Graviton2,Marvell也推出了基於ARM架構訂製的ThunderX3處理器,華為海思也推出了基於Neoverse N1設計的鯤鵬系列伺服器。

業內有觀點認為,ARM在雲端市場要成功的一個關鍵就是滿足大型互聯網公司和雲服務提供商的訂製化需求。

「在異構計算里,ARM有一個很大的機遇,就是我們如何提供緊耦合或是訂製化的能力,甚至是通過多核封裝或多晶片組裝技術,將來自生態系統、IP技術與雲廠商的需求與技術整合在一起。」 Chris Bergey說,對於沒有很強設計經驗的客戶而言,他們更傾向於選擇Neoverse核。

ARM架構晶片能未來能否覆蓋從終端到邊緣再到雲端?現在看來,這種成功除了ARM的努力外,最終是否會被NVIDIA 收購也成為了關鍵因素。