為什麼很多中國公司在做 AI 晶片?

  • 2020 年 10 月 9 日
  • 筆記

據網上搜到的新聞報道,截止2019年,已經有20家企業投入到 AI 晶片的研發中,其中有很多廠商的晶片已經流片甚至商用了。為何有這麼多公司在做AI晶片呢?簡單來講就是四個字:有利可圖。具體來說有以下三點。

1. 演算法對算力需求很大

其實神經網路、反向傳播的演算法早在1986年就提出來了,但是深度學習從2012年開始才大放異彩,原因是它需要輸入海量數據和非常大的算力,在當時不具備這樣的條件。如今隨著人工智慧在影像識別、語音識別、自動翻譯等領域的飛速發展,新的模型每天都在出現。他們對算力的要求越來越高,據統計算力需求在2012年之後每3.4個月翻一番。算力即完成任務所需的計算次數。Google 2019年提出的 EfficientNet B7的深度學習模型,每次推理需要360億次基本運算,是七年前同類模型(AlexNet)運算需求的50倍。人工智慧領域所涉及運算常具有大運算量、高並發、訪存頻寬高的特點。

2. AI 落地對能效要求高

首先明確兩個概念:能效和通用性。能效指單位功耗內能做多少次運算,通用性指能覆蓋多大應用面。能效使用TOPS/W(Tera Operations per Second per Watt),即每秒每瓦可進行的十億次操作數量來衡量。AI 專用晶片可以做到 100 TOPS/W以上,是 CPU 的萬倍,GPU 的百倍以上。

傳統晶片的速度和能效難以滿足大規模深度學習應用的需求。傳統的 CPU 等通用處理器類似瑞士軍刀,什麼都可以做,但是效果一般。比如在某些特定領域如深度學習類型的運算上速度不夠快。GPU 因為支援大規模並發,可以用於深度學習運算。但是它最初是面向圖形渲染領域,並不是專用於神經網路運算的,所以能效並不高,價格很貴,只適合在伺服器上使用。2016年 Alpha Go 與李世石對弈時,用了1202個CPU和176個GPU,每盤棋耗資上千美元的電費,而人類選手李世石的功耗僅為20瓦。

目前 AI 行業迅猛發展,市場容量越來越大,單純安防這個影片分析領域就能誕生四個獨角獸,所以研究機構及公司就有動力去設計製造更專用的處理器晶片。設計晶片的目標就是算的更快、更精確,價格更低。未來每台電腦可能都需要配備 AI 晶片,就跟現在的 GPU 一樣。目前中國的一些 AI 廠商在落地時,成本中有一大半是硬體的成本,而硬體中絕大部分成本都在 GPU 上。所以目前深度學習的落地成本還很高,要想讓 AI 走進尋常百姓家還有待時日。

3. 國家政策支援

自2015年以來,國務院、工信部、國家發改委、財政部等陸續頒布了很多針對性的優惠政策,確定了很多重大專項,明確了要重點突破高端處理器領域。這些政策為行業提供了財政、稅收、技術和人才等多方面的支援,可以說 AI 及晶片領域未來可期。

中國多家做 AI 晶片的公司

今年年中上市的寒武紀做通用的 AI 晶片,產品覆蓋雲邊端,有推理也有訓練。華為在19年前在手機上採用的寒武紀晶片,後來自研的晶片出來之後跟寒武紀分道揚鑣。華為產品也是覆蓋雲邊端,強調雲邊一體的開發體驗。創業公司地平線主要做自動駕駛和AIoT場景下的邊緣側晶片。紫光展銳推出的「虎賁」和「春藤」,主要覆蓋通訊和物聯網晶片。還有一些區塊鏈企業,比如嘉楠科技和比特大陸。一線互聯網公司如阿里平頭哥的玄鐵910,百度崑崙,騰訊雲等。新晉的人工智慧企業如依圖也發布了了自己的AI晶片求索。

如果希望看到更多人工智慧領域的科普,請點右下角「推薦」!

歡迎關注我的微信公眾帳號,會在第一時間更新

code

參考資料

  1. 《智慧計算系統》
  2. 寒武紀招股書
  3. 寒武紀創始人陳天石:如何評價Google最新AI計算高性能專用硬體TPU
  4. CB Insights發布中國晶片設計企業榜