所有IP自主研發 性能成倍增長!龍芯3A/B4000發布:下代追平AMD
- 2019 年 12 月 24 日
- 資訊
12月24日,國產CPU廠商龍芯在北京正式發布自主研發的新一代通用處理器——龍芯3A4000、龍芯3B4000,其中桌面版的龍芯3A在性能上提升一倍以上,多路伺服器版可提升3倍性能。
與此同時,龍芯還宣布2019年其處理器累計出貨已達50萬顆。此外還透露,12nm製程的下代CPU性能可達同期AMD水平。
在當天的發布會上,聯想、中科曙光、方正、中國運載火箭技術研究院等也發布了基於龍芯新一代通用處理器的桌面電腦、筆記型電腦、伺服器、網路安全設備、工業控制電腦等產品。
龍芯2019年出貨已達50萬顆
目前龍芯主要有三大系列產品:
龍芯1號:面向特定應用需求的訂製的“小CPU”系列,為32位低功耗、低成本處理器,主要針對低端嵌入式和專用應用領域;
龍芯2號:面向工控和終端應用的“中CPU”系列,主要為64位低功耗單核或雙核列處理器;
龍芯3號:面向桌面/伺服器類應用的“大CPU”系列,主要為為64位多核系列處理器。
據龍芯中科副總裁張戈介紹,目前龍芯在政企、安全、金融、能源等應用場景均有廣泛應用,2019年龍芯晶片出貨量已達到50萬顆以上,在國產化應用市場份額領先。
雖然50萬片的出貨量看上去並不大,但是對於一款完全自主可控的國產CPU來說,已經是非常不錯的成績了,也已經是目前國產CPU廠商當中出貨最大的了。
值得注意的是,在今年10月的第十四屆“中國芯”積體電路產業促進大會在青島隆重舉辦。龍芯提報的龍芯3A/B3000處理器,憑藉其優秀的市場表現,榮獲第十四屆“中國芯”“優秀市場表現產品”稱號。
據介紹,龍芯3A/B3000系列累計出貨量已達30萬片以上,已應用於政企辦公、網安、能源、交通、教育等多個領域,並得到了用戶的廣泛認可,具備相當的市場競爭力。
龍芯3A/B4000系列發布,單核性能與ADM“挖掘機”相當
相比上一代的龍芯3A/B3000系列來說,此次時隔近兩年才發布的龍芯3A/B4000系列,雖然採用的還是28nm FDSOI製程,但是在性能上有了成倍的提升。
據介紹,龍芯3A4000/3B4000採用了龍芯最新研製的新一代高性能處理器內核GS464V(上一代是GS464E),支援片內互聯網匯流排、HT3.0系統匯流排、DDR4記憶體匯流排,同時還支援UART、SPI等介面。主頻提升至1.5GHz-2.0GHz。
其中龍芯3A4000是針對桌面級的,核心數量可達4-8核,擁有雙DDR4-2400/2133記憶體通道,雙HT3.0系統匯流排,效率提升一倍。而龍芯3B4000則是面向高性能計算的,核心數量可達16-32核。
在性能方面,龍芯3A4000系列的SPEC CPU2006定點和浮點單核分值均超過20分,達到了上一代產品的兩倍。
反映傳統桌面性能的SPEC INT2000的單核base測試分數也從上一代的930分提高到了2090分,達到了與AMD 28nm最後產品“挖掘機”相當,高於14nm ARM處理器的水平。
龍芯3B4000支援4路直連,四路伺服器性能是上一代的3B3000雙路伺服器性能的4倍。此外,虛擬機效率也從上一代產品的88%提高到98%。
中科院計算技術研究所總工程師、龍芯中科總裁、首席科學家胡偉武博士表示,龍芯3A/B4000系列已經基本完成了設計能力方面的補課,我們通過設計優化實現了單核通用處理性能的提升。
在封裝和功耗方面,龍芯表示,龍芯3A4000的封裝尺寸比3A3000更小,尺寸為37.5mm*37.5mm,支援普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支援四層板,典型功耗為30-40W。
值得一提的是,龍芯4000系列內部的GS132E核心主要負責監控主核運行,並進行動態功耗管理。
在具體體驗方面,基於龍芯3A4000的筆記型電腦工作時間比基於3A3000的筆記型電腦提高了一倍以上。
不過,胡偉武也指出,龍芯3A4000的30-40W的典型功耗還是比較大,這主要是由於所採用的是製程不夠先進。所以,建議在科學計算環境下使用256位浮點向量時,適當降低電壓和頻率。
所有模組源程式碼均為自主研發
需要指出的是,作為脫胎於中科院計算所的國產CPU廠商,龍芯CPU目前主要應用領域也是在黨政辦公、航天、金融、能源等領域,因此對於CPU的自主可控及安全方面也有著更高的要求。
胡偉武強調,龍芯晶片所有源程式碼均為自主設計,所有模組源程式碼和各類全訂製模組均為自主研發,除了廠家提供的標準單元庫和Memory Compiler(記憶體編譯器)外,沒有任何第三方IP。
在CPU的安全方面,龍芯4000系列擁有強大的片內安全機制。通過專門指令實現了對MD5、AES、SHA等加解密演算法的支援;同時集成了專用的安全可信模組,支援國密演算法;支援“影子棧”等訪問控制機制,對於作業系統函數調用、進程切換、IO訪問可以有效監督。可以有效的防範此前x86和Arm處理器爆出的Meltdown和Spectre漏洞。
作業系統及軟體生態建設
得益於PC市場數十年的積累,X86架構的CPU的系統及軟體生態是最為豐富的。而Arm架構的CPU也受益於Arm在移動市場的霸主地位,系統及軟體生態也是非常豐富。相比之下,對於既非X86也非Arm架構的龍芯來說,在系統及軟體生態上則需要花費更多的精力去建設。
目前龍芯針對不同的應用場景,已經推出了適配不同作業系統的解決方案。比如,Loongnix是面向通用資訊化系統的,基於通用Linux平台進行完善和優化,為統一作業系統UOS龍芯版提供支撐。
LoongOS是面向高可靠實時終端的,基於Linux/RT-Linux構建了簡潔高效的OS。
LoongWorks是面向實時嵌入式應用的,針對歷史應用,基於VxWorks內核,完善圖形和網路等API。
值得注意的是,就在本月初,國產統一作業系統UOS(unity operating system)龍芯版正式發布,已適用龍芯3A3000系列、龍芯3B3000系列、3A4000系列、龍芯3B4000系列。
據介紹,在近半年的時間裡,UOS開發團隊與龍芯中科的系統軟體研發團隊針對Linux內核、BIOS韌體、編譯器、瀏覽器、圖形驅動等多項基礎軟體共同解決了幾十項問題,確保UOS在龍芯平台上功能完善、體驗流暢、品質穩定。
另外,為了提升兼容性,胡偉武表示,龍芯將進一步統一系統架構,構建標準規範體系,實現作業系統跨主板整機兼容和CPU代際兼容。
從龍芯3A4000開始,龍芯也將參考設計全面支援統一系統架構,開發支援ACPI主板、韌體、內核及OS的參考設計,以及基於ACPI/EC筆記型電腦標準的解決方案。
下一代產品將實現“突破”
胡偉武表示,龍芯第一代產品算是“基本可用”,屬於“小學畢業”水平;第二代產品則提升到了“可用”的階段,屬於“中學畢業”水平;第三代產品已經“好用”了,屬於“大學畢業”水準了;下一代產品將要與國際晶片巨頭同台競技。
“要想實現與國際晶片巨頭同台競技,首先需要通過幾級階梯登上‘台’去,龍芯現在就是在走最後一級階梯。”胡偉武說到。
據胡偉武透露,龍芯的下一代產品,龍芯3A5000將採用12nm製程,主頻將提高到2.5GHz,同時,其記憶體控制器延遲/寬頻進一步優化,LLC增加一倍,實現作業系統級二進位兼容。單核性能屆時將提高至30分左右,通用性能達到同期AMD的水平,計劃於2020年上半年流片。
龍芯3C5000將同樣採用12nm製程,核心數會進一步增加,支援4至16路伺服器,計劃將於2020年下半年流片。