NVIDIA正式發布CUDA 11工具包:專為安培架構優化

作為GPU加速應用領域最強大的軟體開發平台,NVIDIA近日了發布全新的CUDA 11版本工具包,特別為新誕生的安培架構進行了優化。

CUDA 11完全支援在安培新架構上進行開發,包括A100 GPU,以及基於它的DGX A100、HGX A100等多路系統,並支援安培架構的第三代Tensor張量核心,可針對不同數據類型加速混合精度矩陣計算,比如TF32、Bfloat16。

其他新技能:

- 多實例GPU虛擬化和GPU分區,提升GPU利用率

- 優化庫性能,包括線性代數、快速傅里葉變換(FFT)、矩陣乘法、JPEG解碼等等

- 改進編程與API,包括任務圖表、非同步數據轉移、精細同步、二級快取駐留管理等等

- 增強Nsight開發工具集,包括跟蹤、編譯、調試分析

- 完整支援各種主要CPU架構,包括x86、ARM64、Power

- CUDA C++改進編譯器性能和穩定性、支援新的主編譯器和語言標準(包括C++17)、支援Parallel C++ STL

- 更新作業系統支援

更詳細介紹請參閱:

//devblogs.nvidia.com/cuda-11-features-revealed/

NVIDIA正式發布CUDA 11工具包:專為安培架構優化