283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

晶片顯微拍照大神Fritzchens Fritz終於對NVIDIA RTX 30系列下手了,拆開一塊RTX 3090,拍下了GA102核心的內核圖,而晶片分析大神Locuza藉此研究了GA102核心的內部模組布局。

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

RTX 3090使用的GA102-300-A1 GPU核心。由於裸露在外而沒有散熱頂蓋,很容易觀察到。

它採用三星8nm製程製造,集成283億個電晶體,面積628.4平方毫米。

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

這張高清圖上,可以一目了然地看到GA102核心的布局。

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

對比NVIDIA官方公布的核心照渲染圖,可以發現實際照片與之符合得非常好。

一般來說,這種展示晶片結構的渲染圖都會做很多修飾和調整,使之更加美觀,但是看起來NVIDIA對於GA102非常自信,基本原貌展示了出來,當然細節上還是有很多差異。

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心

從這兩張圖上,可以看到GA102核心的諸多模組,RTX 3090使用的是閹割殘血版,而這裡能看到所有單元。

GA102核心共有7組GPC(圖形處理集群),每個GPC內包含6組TPC(紋理處理集群),而每組TPC內包含兩組SM(流式多處理器),最後每一組SM內包含128個串流處理器,整個核心總計10752個串流處理器(RTX 3090啟用了10496個)。

當然,安培架構的串流處理器已經不再那麼單純,細分的話包括FP32浮點核心、INT32整數核心,這裡就不展開了。

另外,從圖上還可以看到兩組NVLink互連控制器、12組共384-bit GDDR6X顯示記憶體控制器、24塊總計6MB二級快取、指令前端、幾何處理器、光柵處理器、幾何引擎、光柵引擎、ROP光柵單元等等。

不過仍有很多地方無法識別究竟何用,也不確認顯示控制器、PCIe 4.0控制器等等到底在哪裡,另外RT光線追蹤單元、Tensor張量單元也無法直接看出來。

283億電晶體怪獸!顯微鏡下看NVIDIA RTX 30核心