算力超強!NVIDIA發布首款自主CPU:名字亮了

在今天凌晨召開的NVIDIA GTC 2021開發者大會上,NVIDIA CEO黃仁勛正式發布了旗下首款Arm伺服器CPU, 代號「Grace」,主要面向超大規模AI人工智慧、HPC高性能計算,最大特點就是海量的頻寬,號稱是全球首款專為TB級加速計算而設計的CPU

與此同時,NVIDIA還發布了基於Arm IP的BlueField-3 DPU,以及集成了Arm IP的首款算力高達1000TOPS的自動駕駛汽車晶片NVIDIA DRIVE Atlan。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

黃仁勛在會上也表示:「我們每年都會發布激動人心的新品。三類晶片,逐年飛躍,一個架構。」黃仁勛說,數據中心路線圖包括CPU、GPU和DPU這三類晶片,而Grace和BlueField是其中必不可少的關鍵組成部分。每個晶片架構歷經兩年的打磨周期(周期內可能出現轉變),一年專註於x86平台,另一年專註於Arm平台。

NVIDIA首款Arm伺服器CPU Grace

雖然在大家印象里NVIDIA是一家GPU公司,但早在多年前就曾推出過自己的Tegra系列CPU,甚至還一度進入了智慧手機市場。

此次發布的NVIDIA Grace的名字,取自Grace Hopper——格蕾絲·霍珀女士她是電腦史上最早的程式設計師之一,也是編譯語言之母,領導開發了程式語言Cobol。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

據介紹,NVIDIA Grace基於Arm面向數據中心的下一代Neoverse內核架構每個CPU能在SPECrate2017_int_base基準測試中單位時間運行超過300個實例。

NVIDIA Grace還採用了第四代NVIDIA NVLink技術,從CPU到NVIDIA的GPU連接速度超過900GB/s,達到相當於目前伺服器14倍的頻寬。而從CPU到CPU的連接速率也超過了600GB/s。另外,NVIDIA Grace還擁有目前最高的記憶體頻寬,搭配LPDDR5X記憶體可提供超過500GB/s的頻寬,而且支援ECC錯誤校驗。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

在此次會議上,黃仁勛並未公布NVIDIA Grace具體的核心數量、頻率、快取、功耗等數據。不過,黃仁勛表示,明年瑞士國家計算中心(CSCS)和美國洛斯阿拉莫斯國家實驗室分別將推出一款性能強大的AI超級電腦面世,都將採用NVIDIA Grace CPU,據稱其與NVIDIA GPU緊密結合,性能將比目前最先進的NVIDIA DGX系統(在x86 CPU上運行)高出10倍。其中,瑞士國家超級計算中心(CSCS)、慧與(HPE)將聯合使用NVIDIA Grace CPU及下一代NVIDIA GPU,共同打造號稱世界最快AI超頻的「ALPS」(阿爾卑斯山),算力高達20ExaFlops(每秒2千億億次計算),主要用於天氣研究與預報、材料科學等。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

據介紹,NVIDIA Grace處理器計劃2023年正式推出,2025年將會推出下一代。NVIDIA還同時強調,會繼續支援x86架構,未來將堅持x86、Arm兩條路線並行。

新一代數據處理器Bluefield-3 DPU

NVIDIA同時還發布了新一代數據處理器BlueField-3 DPU,為數據中心提供強大的軟體定義網路、存儲和網路安全加速功能。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

據介紹,BlueField-3 DPU的電晶體數量達到了220億個,集成了16個Arm Cortex-A78內核、18M IOPs彈性塊存儲。與上一代的BlueField-2 DPU相比,BlueField-3 DPU實現了10倍的加速計算性能提升和4倍的加密速度。BlueField-3也是首款支援第五代PCIe匯流排並提供數據中心時間同步加速的DPU。

一個BlueField-3 DPU所提供的數據中心服務相當於300個CPU核才能實現的工作負載,以400Gbps的速率,對網路流量進行保護、卸載和加速。

BlueField-3可為NVIDIA Morpheus提供實時的網路可視化、網路威脅的檢測與響應、以及監控、遙測和代理服務,Morpheus是一個先進的基於AI的雲原生網路安全平台。

BlueField-3還利用NVIDIA DOCA(集數據中心於晶片的架構)軟體開發包的優勢,為開發者提供一個完整、開放的軟體平台,開發在BlueField DPU上開發軟體定義和硬體加速的網路、存儲、安全和管理等應用。DOCA已於今日發布並提供下載。

黃仁勛表示: 「現代超大規模雲技術推動數據中心從基礎上走向了新的架構, 利用一種專門針對數據中心基礎架構軟體而設計的新型處理器, 來卸載和加速由虛擬化、網路、存儲、安全和其它雲原生AI服務產生的巨大計算負荷。BlueField DPU正是為此而生。」

BlueField-3是首款為AI和加速計算而設計的DPU,助力各企業在任何規模的應用上都能實現領先的性能和數據中心的安全性。這款DPU針對多租戶、雲原生環境進行了優化,提供數據中心級的軟體定義和硬體加速的網路、存儲、安全和管理等服務。

據介紹,伺服器製造商戴爾、浪潮、聯想和超微正在將BlueField DPU集成到他們的系統中。全球雲服務供應商都在使用BlueField DPU來加速他們的業務,如百度、京東和UCloud。隨著眾多企業對BlueField-3的支援,BlueField生態系統也在不斷擴大,這些企業包括:領先的混合雲平台合作夥伴Canonical、Red Hat和VMware;頭部網路安全提供商Fortinet、Guardicore;存儲供應商DDN?、NetApp和WekaIO;以及邊緣平台供應商Cloudflare、F5和Juniper Networks。

另外值得一提的是,BlueField-3完全向下兼容BlueField-2,提供更加出色的數據中心應用轉移、加速和隔離性能。BlueField-2有雙埠100Gb/s乙太網或雙埠100Gb/s InfiniBand兩種選擇,最多可支援8個Arm核。BlueField-2 DPU還集成了各種不同的加速引擎來加速軟體定義存儲、網路、安全、流媒體、線速TLS/IPSEC加密、5G電信的精確定時、數據中心的時間同步以及其它雲基礎設施服務等。

根據預計,BlueField-3 DPU將於2022年第一季度發布樣品,後續的BlueField-4 DPU將包含640個電晶體,算力達1000TOPS,網路速率達800Gbps。

自動駕駛汽車晶片DRIVE Atlan

NVIDIA在此次會議上還正式發布了最新一款智慧汽車和自動駕駛汽車晶片組——DRIVE Atlan,單顆晶片的算力能夠達到1000TOPS,這也是業內首款達到1000TOPS算力的晶片,將應用於L4及L5級別自動駕駛。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

作為參考,上一代Orin算力為254TOPS,而特斯拉自研的晶片算力則為144 TOPS。足以可見,NVIDIA Atlan的強大實力。

NVIDIA發布首款Arm伺服器CPU!命名「格蕾絲」  取自編譯語言之母

Atlan SoC集成了NVIDIA最新的安培架構GPU核心、以及Arm架構的Grace CPU核心、深度學習和電腦視覺加速器單元以及BlueField DPU核心,該平台將實現每秒執行1000萬億次操作(1000 TOPS),是上一代產品的4倍,且預估其SPECint得分將超過100(SPECrate2017_int),高於當今大多數robotaxi的總計算量。Atlan還是首款配備NVIDIA BlueField DPU的SoC,可提供可信賴的安全性、高級網路和存儲服務。

Atlan SoC將於2023年向開發者提供樣品,2025年左右上市的車型就可能搭載。

同時,NVIDIA 也公布了最新L4級自動駕駛開發車Hyperion 8,車輛搭載2顆NVIDIA Orin SoC用作自動駕駛計算,並用1顆Orin SoC監測車內安全員,同時用4顆Orin SoC與4顆MLNX晶片記錄3D環境。

車外感測器使用8個800萬像素、4個300萬像素魚眼攝影機、3個座艙內攝影機、9個毫米波雷達以及2個光學雷達。

這輛開發車將在今年年底面向開發者開放。黃仁勛還宣布自動駕駛模擬平台DRIVE Sim將於今年夏季開放使用。

關於對Arm的收購進展

去年10月宣布以400億收購Arm之後,僅6個月之後,NVIDIA就一口氣發布了三款基於Arm IP的產品,這也足見NVIDIA對於Arm技術及其生態的看重。

值得一提的是,目前Arm伺服器CPU陣營當中的兩大玩家——華為和飛騰接連遭到了美國的制裁,這也對於剛有起色的Arm伺服器生態帶來了不小的打擊。此番NVIDIA的加入確實有助於Arm伺服器生態的建設。但是,如果NVIDIA成功收購了Arm,那麼則可能對於Arm生態建設帶來負面的影響。此前不論是Arm聯合創始人赫爾曼·豪澤,還是眾多的Arm CPU廠商都對此NVIDIA收購Arm表達了反對意見。

關於對Arm的收購進展,黃仁勛表示,目前收購工作正在穩妥有序進行。「NVIDIA和各國監管部門進行了積極有效的溝通,我們相信,監管部門會支援NVIDIA收購Arm,因為這有利於市場競爭,有利於半導體行業的技術研發,相信這筆交易會在2022年有個積極正面的結果。」

值得一提的是,NVIDIA此次還公布了與亞馬遜AWS、Ampere Computing、聯發科和Marvell等基於Arm的CPU平台的合作夥伴關係與合作進展,具體內容包括為亞馬遜AWSGraviton2 CPU提供GPU加速、為科學和AI應用開發提供支援的全新HPC開發者套件、提升邊緣影片分析和安全功能、打造新一類基於Arm並搭載NVIDIA RTX GPU的新款PC等。