BAT為何紛紛下場「造芯」?

近日,騰訊招聘官網出現了多個與晶片有關的崗位,引發外界關注。

騰訊招聘披露的晶片研發崗位包括:晶片架構師、晶片驗證工程師、晶片設計工程師等多個職位,工作地點可選擇北京、上海、深圳等。

BAT為何紛紛下場「造芯」?

以晶片架構師為例,職責包括:負責AI晶片和通用處理器或者細分領域的需求分析,主導AI,處理器晶片架構設計,競爭分析和規格定義;負責晶片領域的技術演進路標、關鍵技術,主導關鍵技術和架構的研究;負責大型晶片的架構設計,關鍵模組的把控和設計等。

而晶片設計工程師則要求精通數字電路設計流程,精通RTL程式碼書寫,具有電路優化的經驗;4年以上數字前端設計經驗,有大規模 SoC 晶片設計成功量產經歷以及CPU/NPU 等設計經驗者優先等。

該招聘消息一經爆出,業界開始紛紛猜測:騰訊真的要進軍「卡脖子」晶片領域?

對此疑問,7月16日騰訊相關人士回應稱,這是基於一些業務需要騰訊在特定領域有一些晶片研發的嘗試,主要是AI加速和影片編解碼等,但這並非外界所認為的通用晶片。

互聯網大廠齊聚「造芯」賽道

實際上,騰訊幾年前就已經開始了晶片領域的布局。

2016年11月,騰訊就與阿里一起領投了可編程晶片公司Barefoot Networks的2300萬美元C輪融資。

隨後在2018年,AI晶片公司——上海燧原科技有限公司獲得了騰訊領投的Pre-A輪3.4億元人民幣投資。

2019年6月,騰訊跟投燧原科技的新一輪融資,在今年,騰訊又繼續跟投了燧原科技的C輪融資。

據天眼查數據顯示,2020年3月19日深圳寶安灣騰訊雲計算有限公司成立。該公司經營範圍就包含了積體電路設計、研發等。

然而對於造芯這件事,騰訊並非是以BAT為代表的大型互聯網公司中的唯一一家。

早在2018年7月,百度公司發布雲端全功能AI晶片「崑崙」,其中包含訓練晶片崑崙818-300,推理晶片崑崙818-100。

目前,百度第一代崑崙晶片已於2020年初量產,目前已經規模化部署超過2萬片,第二代崑崙晶片已經流片成功,將於2021年下半年量產。

而阿里巴巴在2018年9月的雲棲大會上宣布成立平頭哥半導體有限公司,主要任務是從事晶片的自研開發與戰略布局。2019年9月阿里巴巴第一顆自研晶片——AI推理晶片含光800正式問世,阿里巴巴表示該晶片已經量產,服務於阿里巴巴內部。

「造芯」的初心,是為了打造一朵更高效的雲

 「隨著雲計算承載的業務規模越來越大,傳統伺服器難以完全滿足雲計算數據中心場景下對超大規模、需求多樣、高性價比、安全可靠以及軟硬體一體化等方面的要求。」

2020 Techo Park開發者大會上騰訊雲伺服器與供應鏈管理部總經理劉裕勛就曾對雷鋒網表示到。

隨著雲計算產業的發展,從技術的角度說,雲計算已經超過IT基礎設施的範疇,正向上定義軟體應用服務,向下定義晶片、伺服器等IT硬體。

從技術角度來看,20年前,虛擬化技術實現了硬體細節的抽象,讓基礎設施成為由軟體管理的單一實體。過去10年,雲計算進一步推動了這一進程,使硬體成為一種抽象資源,而且對於客戶來說,這個資源越來越多地由別人來管理。

然而,雲計算技術雖然使硬體變得抽象,但實際上,雲服務商卻在硬體層面在做這大量的創新工作,開始從最基礎的晶片來構建雲。

同樣,在劉裕勛看來,隨著雲原生理念的不斷推進,雲基礎架構的演進過程中會呈現出三個特點:高複雜度、高性價比、安全性。

當海量業務承載在雲基礎架構設施的時候,業務的多樣性,對於軟硬體一體化的系統實際上提出了更高的要求。面臨這樣的複雜度,雲廠商根據自身的情況,必然要開始自己進行研究相關晶片,或者是與其他晶片廠商聯合起來進行深度訂製,以此來解決各種複雜場景下的兼容性問題。

自研晶片的背後,則是對於BAT這般體量的雲服務商而言,則是性價比最高的一條道路。

而在技術上,以英特爾的CPU為例,CPU的另外一個名字叫通用計算。而這也就代表著,搭載通用CPU的伺服器具有很高的通用性,但是實際的應用中,勢必會造成性能的浪費。

對於普通用戶來說,可能十几上百台伺服器就是應用的極限了,但是互聯網大廠的伺服器動輒就是上萬甚至幾十萬台,因此每台性能的略微降低累積起來都是一個不得了的數字

更重要的是,由於互聯網應用的特殊性,相當一部分新採購的伺服器都要進行針對性的優化,或者需要進行部分配件的調整與革新,也就需要投入大量的人力、精力和財力,造成資源的浪費。

因此對於以騰訊云為代表的雲廠商來說,勢必要從整機的設計上面,去精簡不需要的功能;優化整機的散熱能力,降低能耗。配備一個非常強的供應鏈的管控。去降低計算力的單位成本,並進而將這種成本紅利釋放給數百萬的雲上用戶。

而在安全方面,從晶片層面就進行自研、訂製化,勢必能更好的保證整機系統的安全可靠。

就在近日上海閉幕的世界人工智慧大會上,華為輪值董事長鬍厚崑表示道:「只有基礎打得牢,根技術扎得深,應用創新跑得快,才有人工智慧產業的參天大樹和生態的持續繁榮。」

其中技術要扎到根,根深才能葉茂。值得就是應該大力發展根技術,如處理器、AI計算框架等,增強人工智慧產業的發展韌性。

BAT為何紛紛下場「造芯」?

「硬體創新」已成雲廠商必爭之地

除中國雲廠商之外,國外三家規模較大的雲服務商亞馬遜、微軟和Google也硬體方面進行重金投入。用於提高自身雲平台的性能或者調優服務來滿足特定的用途,例如人工智慧開發等等。

如Google把自己的雲計算戰略重點放在了處理人工智慧工作負載上,為此設計了名為TPU的微處理器家族,號稱相比GPU的成本更低性能更高。

對此,Google曾對外表示,2015年的時候在多層神經網路ResNet 50上訓練一個深度學習模型的成本超過20萬美元,而今天,成本比一杯咖啡還便宜。

此外,微軟Project Olympus是一項針對微軟基於OCP構建的雲平台打造一系列伺服器結構塊的項目。AWS基於ARM的Graviton處理器從2015年開始開發,到現在已經在AWS EC2實例中實現普及。

「硬體專業化可以將延遲、性價比和功耗/性能比提高10倍,但多年來,大多數計算工作負載一直停留在通用處理器上,」AWS工程師James Hamilton在一篇部落格文章中這樣寫道。亞馬遜每年要安裝一百多萬個專用晶片,專門用於機器學習工作負載。

亞馬遜的Nitro項目則是將硬體和軟體結合,消除虛擬化的開銷。

阿里雲的神龍架構則也是通過晶片層面的,通過軟硬體結合的方式,來降低虛擬化損耗,華為雲的擎天、京東的京剛則也是通過同樣的方式。

對此,劉裕勛對雷鋒網表示到,雲上的客戶是非常的「挑剔」的,同時雲計算市場的競爭也很激烈,客戶都希望用低成本,高品質的產品,客戶要求的苛刻會推動我們去做更多的變革和演進。

在此背景下,對於雲服務商而言,通過自研伺服器、自研數據中心技術、再到上層的IaaS、PaaS、SaaS平台的協同打造,勢必是一條必須要走的道路。