深度解讀寒武紀：憑啥和NVIDIA、華為海思較勁？

2015左右，全球開啟了AI芯片的創業熱潮。AI的這一次浪潮不僅吸引了眾多頂級芯片人才選擇創業，也讓多家科技巨頭進入了芯片行業。

不過，AI技術仍在快速發展，AI芯片的評價體系也還在完善，AI芯片領域也還沒有公認的領導者。

此時一個很關鍵的問題是：如何衡量一款AI芯片的好壞？藉著寒武紀科技回復上海證券交易所的問詢函（以下簡稱問詢函）報告，去找到如何從多個角度多層次全面衡量一款AI芯片競爭力的答案。

當然，這個答案當中也包含着寒武紀科技的許多關鍵信息以及它是如何與NVIDIA和華為海思較勁。

先發優勢

在問詢函回復報告中，寒武紀表示與華為海思相比，公司的競爭優勢體現在：

公司專註於人工智能芯片進入該領域的時間更早，具備先發優勢。芯片架構針對人工智能應用及各類算法進行了優化，積累了一批核心技術與關鍵專利，技術創新能力得到業界廣泛認可。

在新技術的研究中，先發的優勢在於，當業界對新技術的關注度還不是很高的時候就開始研究，雖然面臨的挑戰更大，但可以更早把「坑」踩了，更早積累更多的經驗，當產業對新技術的關注度大增的時候，可以將新技術更快地產業化。

但技術的實現有很多種方式，先發優勢並不一定就是最終的技術優勢，技術的選擇也非常關鍵。

架構選擇

在與NVIDIA等老牌芯片巨頭的競爭中，寒武紀在問詢函回復函中表示其優勢在於：

在研發人工智能芯片時，NVIDIA更多基於公司原有的技術儲備和設計理念去適配人工智能的應用和算法，但是GPU、CPU本身並非專門為人工智能相關運算進行開發的芯片產品。而公司的芯片架構針對人工智能應用及各類算法進行了優化，有效提升了產品的性能功耗比和性能價格比。

目前，AI芯片的定義還沒有一個嚴格和公認的標準。比較寬泛的看法是，面向人工智能應用的芯片都可以稱為AI 芯片。因此，CPU、GPU、DSP、FPGA、ASIC都屬於AI芯片的範疇。

這裡需要單獨介紹的是專為AI而設計的芯片。這類芯片經常會統稱為AI專用芯片，要進一步細分的話還可以分為通用型和專用型。兩者的差別在於，通用型是通過對各類智能應用和算法的計算和訪存特點進行抽取和抽象，定義出一套適用於智能算法且相對靈活的指令級和處理器架構，廣泛支持多樣化AI算法和應用。當然，通用型AI芯片是專為AI算法設計，其通用性也不能與CPU和GPU進行比較。

專用型AI芯片（ASIC）則是針對特定的、具體地、相對單一的AI應用專門設計的芯片。

關於CPU、GPU、FPGA、DSP、ASIC的特點以及進行AI計算時的優劣勢，可以參考問詢函中的表格。

市場定位

AI芯片的架構各有特色，不同架構的芯片既可以應用於對性能要求很高的雲端訓練和推理市場，也可以應用於對功耗和成本更敏感的邊緣和終端市場，因此在對比AI芯片的時候，首先要明確是否是同級別競品以及市場定位是否相似。

寒武紀在選取同類競爭對手時候的標準有兩個：

1、面向終端、雲端、邊緣端等智能計算市場有一種或多種芯片產品發佈上市的芯片公司；

2、相關芯片產品有顯著銷售規模且公開披露該類產品的業務、財務資料相對較多。

基於上述原則，在智能計算市場中，行業內主要企業的具體情況如下所示：

寒武紀科技得出的結論是，綜合來看，公司在業務與技術部分介紹時綜合考慮了主要產品或主營業務相似度、行業知名度及行業地位、產品銷售情況、信息披露透明度等因素，選取NVIDIA、英特爾、AMD、ARM、華為海思等五家企業作為同行業可比公司。

不過，AMD雖然同時擁有高性能CPU和GPU產品，但並未針對AI算法做特別優化，AMD也未在對外的宣傳中提及其AI性能，所以在做AI芯片產品的對比時，AMD經常不會放在對比列表中。

選定具備可比性的同類競品之後，接下來需要對比的就是產品的技術，包括直接影響芯片最終性能的硬件技術和軟件技術。

芯片關鍵技術指標

在問詢函回復中，寒武紀用NVIDIA和華為海思的產品進行了詳細的比較，在芯片的物理技術層面從底層的處理器微架構、指令集、SoC芯片設計、芯片功能驗證到先進工藝物理設計、芯片封裝設計與量產測試、硬件系統設計選取衡量標準，進行了詳細對比。

軟件層面從編程框架適配與優化、編程語言、編譯器、高性能數學庫、虛擬化軟件、核心驅動、雲邊端一體化開發環境7個方面選取衡量標準進行一一對比。

7個硬件關鍵技術對比：

7個基礎系統軟件技術對比：

軟硬件的關鍵技術的特性以及軟硬件融合的程度直接決定了AI芯片的單核、多核性能以及對不同數據精度和算法支持的表現。也是影響業界評判一款芯片PPA（Power、Performance、Area）的關鍵。根據AI芯片發展的應用範疇，在性能功耗比、製造工藝、軟件成熟度以及未來發展趨勢上，AI芯片也分主流技術水平以及未來技術發展趨勢。

注1：性能功耗比按理論峰值性能和芯片整體功耗進行估計。

注2： INT2/4/8/16 分別代表進行 2 位、 4 位、 8 位、 16 位定點運算， FP16/32 分別代表進行16 位、 32 位浮點運算， BF 16 代表進行 16 位腦浮點運算。

注3：表中所述終端芯片都指具備專門化、本地化人工智能處理能力的 SoC 芯片。

注4：上表中沒有針對專用型智能芯片（ASIC）進行比較，因該類芯片功能相對單一，通常無須使用 Fin Fet 等先進制造工藝，與通用型智能芯片的行業特點顯著不同，且不是公司主營業務所關注的重點。

注5：訓練和推理的性能功耗比均以理論峰值性能計算。

資金實力與人才實力

無論是傳統芯片還是AI芯片，能夠持續投入研發進行產品迭代才是保持芯片競爭力的關鍵。特別是，芯片行業是一個長周期，高投入的行業。因此，資金實力與人才也是影響AI芯片競爭力的關鍵。

相比NVIDIA和華為海思，寒武紀有着顯著的資金實力差距，這也是寒武紀要在科創板上市的重要原因。

根據NVIDIA 2020財年財務報告，截至2020財年末，NVIDIA的現金及現金等價物為108.96億美元，2020財年NVIDIA的研發費用為28.29億美元。華為海思未上市，據公開報道2019年研發投入約為24.39億美元。

除了資金實力與巨頭相差懸殊，人才方面也是寒武紀努力在加強的，所以寒武紀的人員支出在持續增加。寒武紀員工人數從2017年末的80人增長到2019年末的868人。2017年2019年，公司支付給職工以及為職工支付的現金分別為1,512.7萬元、9,300.64萬元和29,818.82 萬元，增長速度較快。

截至2019年末，寒武紀研發人員人數達到680人，碩士及以上學歷人員546人。

單位：人，萬元