AI中各種浮點精度概念集合：fp16，fp32，bf16，tf32，fp24，pxr24，ef32 - ⎝⎛CodingNote.cc ⎞⎠

AI中各種浮點精度概念集合：fp16，fp32，bf16，tf32，fp24，pxr24，ef32

2021 年 8 月 21 日
筆記
AI, 人工智慧, 技術, 浮點精度

常見的浮點類型有fp16，fp32，bf16，tf32，fp24，pxr24，ef32，能表達的數據範圍主要看exponent，精度主要看fraction。

可以看出表達的數據範圍看fp32，bf16，tf32，pxr24和ef32都是一樣的，因為大家能表達的都是-2²⁵⁴~2²⁵⁵這個大概範圍。fp24到表達範圍比上面這些小，是-2¹²⁶~2¹²⁷

從精度上看fp32>pxr24>ef32>tf32>bf16，燧原的ef32都精度比Nvidia的fp32的精度多了一位，但都顯著優於google的bf16，燧原的ef32，Nvidia的tf32都是使用fp16的計算性能像fp32的表達範圍靠齊的一種嘗試。

之前看《Enflame 2.0 Whitepaper_Dorado》的時候，看到描述tf32是1+8+11，還和一位同事糾結了一下，後來才知道燧原白皮書裡面說的tf32其實是自己的ef32，並不是Nvidia的tf32，多設計一位精度最初是為了規避專利風險，後面也有精度和性能的折中考慮。

ef32總共20bits，而tf32是19bits，從硬體設計上說20bits的性能應該比19bits更好，當前也不排除Nvidia另外拿一個bit來作為奇偶校驗位之類的設計。

另外，AI中也有很多場合用定點數據，就是程式語言裡面說的整型，一般用INT8，類似C語言裡面的char和byte。

IEEE half-precision

16-bit float

IEEE 754 single-precision

32-bit float

bfloat16

NVidia’s TensorFloat(tf32)

AMD’s fp24 format

Pixar’s PXR24 format

Enflame’s ef32

更多參考文檔:

Tags: AI 人工智慧技術浮點精度

Previous post

蘋果瘋狂生產 iPhone 13首批備貨量曝光！史無前例

Next post

CVPR2021 | 重新思考BatchNorm中的Batch