智算中心建設的「暗礁」與「燈塔」

  • 2021 年 9 月 15 日
  • AI

作者 | 維克多

是時候讓智算中心「普惠自由」了

一家公司的辦公室有電力供應,這能給這家公司帶來區別於競爭對手的競爭優勢嗎? 

答案不言自明。

現在人工智能(AI)技術與公司競爭優勢的關係正類似於電力之於公司。一百多年來,電力曾給各個產業賦能,AI也同樣可以給各個產業賦能。

從國家的層面來看,頂層設計似乎早已看到了這種趨勢,「新基建」一詞在把AI看成國之重器的同時,也明確了AI和IT具有同樣的公共物品屬性:希望每個企業、個體都能用得起,並且因此而被賦能。

那麼對於AI基礎設施而言,如何做到既要用得起又要用得好呢?——必須着眼於降低成本和大規模通用。


1

什麼是AI新基建?

智算中心的一般定義是「融合架構計算系統為平台,以數據為資源,能夠以強大算力驅動AI模型對數據進行深度加工,源源不斷產生各種智慧計算服務,並通過網絡以雲服務形式供應給組織及個人。」 

其作為人工智能產業發展的重要底層基礎設施形態,已經成為世界各國競爭角逐的戰略布局。在政策扶持、需求牽引下,智算中心「落地潮」在各地被快速掀起。然而在加快步伐的背後,我國人工智能算力基礎設施建設也同樣面臨一系列問題與挑戰。

正如9月11日 ,國家工業信息安全發展研究中心在《新一代人工智能算力基礎設施發展研究報告》中指出的兩點:

一是市場對算力的概念混淆,導致建設方向和建設需求錯位;

二是行業定價標準混亂,針對人工智能算力基礎設施建設的價格標準並未統一,各地同等規模項目的價格相差巨大。

在建設思路上,中國大多數計算中心採取了算力性能發展優先,再拉動應用發展的策略,忽視上層應用遷移及兼容程度,導致算力系統的初期應用效率偏低,無法完全支撐全面的智能化應用場景需求。

另一方面,算力基礎設施和傳統基礎設施的特徵相同,都具有高投入、高風險、高壟斷性的特點。實力和能力的限制,意味着智算中心不是滿大街都是,而是少量的。

而當前智算中心的建設情況是:哪些地方和企業有能力和實力去建設智算中心,其實沒有經過嚴格的論證,因此導致一些地方的建設的AI基礎設施與當地產業發展需求不匹配,出現重建輕用、重複建設等現象。

智算中心的建設成本主要分為三個方面:第一個是基礎設施的廠房建設,第二個是需要的服務器、芯片等設備。第三個是後期的運維成本、電費等等。據知情人士透漏:「初步計算,滿足基本智算中心的也得一兩個億起步的投入規模。」

但從宏觀來看,當前智算中心的建設情況是:目前各地都建,建設成本差距最大達6倍多。據網絡公開信息顯示,以國內四個人工智能計算中心的摺合單位算力建設成本投入為例,可以看到從最高的每100P16位算力投入4.6億,到最低的7500萬,差價達到了6.2倍。

「雖然一些人力成本、電力在地區間存在差異,但六倍的差距差距我還是沒有想到的。」國家工業信息安全發展研究中心副總工程師兼信息政策所所長黃鵬轉而補充道:「至於原因,我認為是前期調研缺乏,尤其是智算中心的發展處於初期階段,整個行業還是在摸索、實踐過程當中,相信後面隨着它發展的越來越好,可持續能力越來越強,成本會降下來。」

話里話外,弦外之音,為了優化國家資源的使用,智算中心的建設應該參考標準,規範行業價格。


2

什麼樣的基建才能「賦能」?

當前各地建設算力中心有兩個目的,第一,通過基礎設施投入之後,其本身能夠發展成為一個產業;第二,基礎設施擁有能力之後,形成產業、企業集聚效應。

前者是將新一代信息技術產業作為它的支撐、支柱性、引領性的產業,例子是浙江,其進行了一系列的數據改革,實現了一網通辦,政府的服務能力越來越強;後者是滿足賦能要求,賦能需要AI技術的企業創造價值。

雖然是兩個目的,但卻有同一個內涵:智算中心覆蓋很多的科學、工程實驗,還有人工智能的測試階段、推理階段。因此,智算中心一定要跟當地的實際應用和場景緊密結合。

另一方面,基礎設施重在「基礎」兩個字,智算中心必須開放,首先要能夠兼容、支持絕大多數的應用需求,至少80%以上;其次,要有打造生態的「雄心」,能夠兼容主流軟件應用生態,具備使用面廣、遷移靈活、編譯開發難度低等特點。

另外,普惠也是新一代智算中心所要做的。智算中心前期需要大量的資金、人力投入,這也意味着前期智算中心的服務價格可能中小企業無法承受,但這種基礎設施有一個規律:總成本或許很大,但邊際成本非常小,因此,隨着使用人數的增多,其平均成本遞減。

價格逐漸下降是普惠的一個標誌,但必須普惠的另一個標誌源於人工智能的特點:越用越智能。只有越來越多的人使用智算中心,增強優勢,補全缺點,才能成為現代化強國基礎設施的內核。

只有技術被廣泛採用,才能使得通用的標準逐漸形成,技術的使用方式也會慢慢變得標準化了,最佳實踐被廣泛理解和模仿,最後變成基礎設施的一部分,這也是新一代智算中心必須普惠的重要原因。

作為一種新型的公共服務平台,《新一代人工智能算力基礎設施發展研究報告》也指出新一代人工智能算力基礎設施應考慮其包容性、普惠性、安全性、共享性及節能性,應成為能夠覆蓋多元算力的創新融合型算力平台、能夠兼容行業主流軟件的開放包容型算力平台、能夠確保自主可信和持續升級的安全可信型算力平台、能夠實現資源跨區域流動的快速靈活型算力平台,以及低能耗、高效能的綠色節能型算力平台。

雷鋒網雷鋒網雷鋒網