ARM新一代超級核心發布!一性能直接翻番

今天,ARM發布了2020年度新品家族,包括純粹64位的超大核心Cortex-X2、大核心Cortex-A710、小核心Cortex-A510(分別取代X1、A78、A55),三級快取和叢簇設計DSU-110,互連網格網路IP CI-700,晶片網路IP NI-400。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

今年3月底,ARM正式發布了64位指令集ARMv9,號稱10年來最重要的創新,IPC性能提升多達30%。

4月底,我們看到了ARMv9指令集的首個產品,面向數據中心的Neoverse N2(同時還有32位的Nerovers V1)。

現在,ARMv9首次來到了消費級市場,而且同時用於三種不同級別的核心,上來就是完整的一整套解決方案。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

先來看超大核心X2,僅支援AArch64 64位指令而不再兼容32位,擁有全新層級的性能。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

前端方面,分支預測與預取單元解耦分離,從而可以在內核之前提前運行,從而減少預測錯誤,同時改進了分支預測精度,提升了大型指令負載的性能。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

核心方面,流水線長度從11個指令周期減少到10個,其中分派階段從2個周期減少到1個,這可是個非常大的變動。

同時,亂序執行窗口增大了最多30%,244條增至最多288條,再加上指令壓縮和綁定,實際還可以保存更多。

FP/ASIMD流水線現在支援SVE2,矢量長度為128b,可以大大提升機器學習性能。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

後端方面,載入存儲窗口和結構增大了33%,可以提升記憶體級並行度,一級快取d-TLB也增大了20%,另外增強了數據預取能力。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

性能方面,ARM宣稱X2相比於X1整數性能提升16%,機器學習性能則可以翻一番,不過注意對比時X2的三級快取容量為8MB,增大了一倍。

X1核心何時商用取決於晶片廠商,不過ARM提到它正在用於筆記型電腦等大屏計算設備,顯然已經有了不少設計,只待宣布。

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番

ARM Cortex-X2超大核心發布:純粹64位、機器學習性能翻番