現代GPGPU 架構匯總

        本篇是GPGPU 架構匯總的總章,參考的是AMD公布OpenCL 手冊,該手冊總結了AMD. Nvdia 早年的GPGPU體系架構,以及Opencl 各個API 與硬體結構的映射關係。本篇除了整理這兩家的GPU 架構,也會增加Intel dGPU的架構(牙膏廠終於回過神了。。。。) 

 對於現代的 GPU,通常的它的控制邏輯單元比較簡單(和 cpu 相比), cache 也比較小 。

 執行緒切換開銷比較小,都是輕量級的執行緒 

 GPU 的每個「核」有大量的 ALU 以及很小的用戶可管理的 cache 

 記憶體匯流排都是基於頻寬優化的。 150GB/s 的頻寬可以使得大量 ALU 同時進行記憶體操作 。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

      *  AMD GPU 硬體架構 

      *  Nvdia GPU Femi 架構 

      *  Intel  GPU Gen11 架構