現代GPGPU 架構匯總
- 2022 年 11 月 2 日
- 筆記
- 並行編程與GPU 架構
本篇是GPGPU 架構匯總的總章,參考的是AMD公布OpenCL 手冊,該手冊總結了AMD. Nvdia 早年的GPGPU體系架構,以及Opencl 各個API 與硬體結構的映射關係。本篇除了整理這兩家的GPU 架構,也會增加Intel dGPU的架構(牙膏廠終於回過神了。。。。)
對於現代的 GPU,通常的它的控制邏輯單元比較簡單(和 cpu 相比), cache 也比較小 。
執行緒切換開銷比較小,都是輕量級的執行緒
GPU 的每個「核」有大量的 ALU 以及很小的用戶可管理的 cache。
記憶體匯流排都是基於頻寬優化的。 150GB/s 的頻寬可以使得大量 ALU 同時進行記憶體操作 。
* Nvdia GPU Femi 架構
* Intel GPU Gen11 架構