奮戰三天三夜,清華大學蟬聯SC國際大學生超頻競賽總冠軍!

  • 2020 年 11 月 25 日
  • AI

作者 | 陳大鑫

北京時間11月20日凌晨,SC20國際大學生超頻競賽總決賽結果公布,由清華大學電腦系組建的清華大學學生超頻團隊奪得SC20 國際大學生超頻競賽總冠軍!

圖註:清華大學學生超頻團隊奪得總成績冠軍

清華大學同時也取得了LINPACK基準測試最高性能獎,獲得雙料冠軍

圖註:清華大學學生超頻團隊獲LINPACK基準測試最高性能獎

這也是清華繼SC18、SC19競賽奪冠後拿下的三連冠!

1

比賽介紹

SC是國際超頻領域的頂級會議,國際影響力巨大,由SC國際超頻大會組委會主辦,每年舉辦一次,主要由展會和學術會議構成。

作為會議的重要組成部分,SC超頻競賽吸引著世界各國家和地區的眾多高校參與,與ASC超頻競賽和ISC超頻競賽並列為世界最具權威性的三大國際大學生超頻競賽。

比賽旨在促進大學生與工業界之間的聯繫,推動世界各地區超頻青年人才交流和培養,提升超頻應用水平和研發能力。

本次決賽共有來自清華大學、北京大學、上海交通大學、南方科技大學、上海科技大學、麻省理工學院、加州大學聖地亞哥分校、喬治亞理工學院、伊利諾伊大學、蘇黎世聯邦理工學院等海內外頂級的19支隊伍參賽。

代表清華參加本次SC20比賽的隊伍由6名來自清華大學電腦系的本科生組成:

張晨(2017級)、陳嘉傑(2017級)、王雨田(2017級)、鍾閏鑫(2017級)、宋澤宇(2018級)、翟明書(2018級);

指導教師為清華大學電腦系副教授翟季冬、助理研究員韓文弢和助理研究員甘霖

清華大學SC20參賽隊員及指導老師:前排自左至右依次為鍾閏鑫、陳嘉傑、張晨;後排自左至右依次為韓文弢、翟季冬、王雨田、宋澤宇、翟明書。

受新冠疫情影響,本次比賽改為線上舉行。新的規則要求各參賽隊伍在3700美元的雲計算預算限制下,在組委會提供的雲計算平台中自行選取機器配置搭建計算集群系統。

賽題包括五項任務:
1、基準測試程式LINPACK、HPCG和IO500;

2、地球系統模式CESM;

3、分子動力學模型GROMACS;

4、SC19論文復現題「大規模並行CT重建MemXCT」;

5、現場公布的神秘應用「圖社區發現miniVite」。

值得一提的是,本次比賽中在LINPACK、HPCG、IO500三個經典的基準測試賽題中,清華以絕對優勢排名第一,其中IO500在清華大學高性能計算研究所自主研製的MadFS支援下取得了143.73分的成績,是第二名的5倍多。    

比賽最終榜單

2

問答專訪

在得知清華大學學生超頻團隊獲得冠軍後,AI科技評論第一時間聯繫到了他們,並針對本次比賽進行了交流。
1、AI科技評論:決賽名單是怎麼確定的?
清華大學學生超頻團隊:我們需要在7月初的時候向主辦方提交參賽提案,提案包括隊伍的專長、歷史成績、成員的技術背景和多樣性、比賽策略、比賽準備、可以獲得的外部支援等方面的內容。最後主辦方邀請超頻領域專家對提出申請的隊伍進行評估,選出入圍隊伍。
2AI科技評論:比賽的任務和指標以及比賽各種限制(時間、硬體)是什麼?
清華大學學生超頻團隊:賽前公布的規則要求隊伍在 Azure CycleCloud 雲計算平台上使用不超過3200美元的預算運行所有賽題。
我們需要在預算以及賽前申請的機器型號的限制下,合理分配各個賽題使用的雲資源,從而使得隊伍在所有賽題上綜合獲得最好的得分。
為考察隊伍的應變能力,主辦方在比賽結束前12小時突然將預算提升為3700美元,預算增多看似是個好事,對各個隊伍沖高分肯定有好處,但卻對整個比賽的策略應變、賽題資源分配提出了更高的要求,要比誰能更高效地利用增加的預算來產生最高的效益。
本次比賽的賽題包括基準測試程式LINPACK、HPCG和IO500、地球系統模式CESM、分子動力學模型GROMACS、SC19論文復現題「大規模並行CT重建MemXCT」,以及現場公布的神秘應用「圖社區發現miniVite」,我們需要在吞吐量、總運行時間、計算效率等指標上獲得儘可能好的結果。
此外,我們還需要設計在 SC20 會議上展出的海報,並在會議專門設置的環節上作報告展示我們的工作,這些活動的表現也會被記入總分。

比賽的時間是連續72小時,也就是不間斷的三天三夜。可選硬體包括Azure CycleCloud 上的 Intel CPU、AMDCPU及 K80、P100、V100等型號的 GPU。

清華大學學生超頻團隊海報(節選)
3、AI科技評論:本次比賽的難點在哪裡,咱們是如何突破的,以及有哪些創新點?
清華大學學生超頻團隊比賽的各個賽題都具有挑戰。
LINPACK/HPCG是兩個經典的基準測試程式,用以測試集群的浮點運算性能,只有使用極大的算力才能獲得高分,但巨大的算力背後是極高的花費,我們在比賽中使用了144塊 V100來運行這個題目,每小時的花費高達533美元,也就是一個小時就足以花去總預算的1/6,因而這兩個程式對資源調配以及負責運行的隊員的心理素質、突發情況處理都有極大的考驗。
IO500是一個比較新的基準測試程式,主要測試文件系統的IO。

我們使用了清華大學電腦系高性能計算研究所自主研製的MadFS 文件系統,取得了143.73分的成績。

這一文件系統也被用在了鵬城實驗室的超頻系統上,參加了全球公開的IO500測試,獲得了今年IO500 榜單的第一名。

圖源://www.vi4io.org/io500/start

CESM 的最大困難來自於編譯,我們編譯了大量依賴庫,修復了很多版本兼容性問題,才得以成功運行程式。       
因為程式的 IO 量巨大,我們需要對它使用的存儲系統進行特殊考慮。
此外,為達到最優的性能,我們還需要手動為各個進程指定任務。GROMACS 是一個分子動力學程式,可以用於分析新冠病毒蛋白。

       

比賽雲端資源消耗圖

本次比賽中,這道賽題的總運算量十分巨大,數據處理極為繁瑣,對相關隊員的臨場決策能力及對軟體的熟悉程度都是極大的考驗。
論文復現是 SC 競賽的特色題目,負責此賽題的隊員需要在72小時的時間裡,復現出原論文的主要結果,並寫出一篇接近國際期刊發表水平的復現報告,是對相關成員的實驗設計能力、論文寫作能力的極大考驗。
現場公布的神秘應用miniVite是一個數千行的圖計算程式,我們在比賽中迅速讀懂了源程式碼,並對其中的核心數據結構進行了優化,從而加速了程式的運行過程。

3

冠軍的背後

這是清華超頻團隊拿下的SC三連冠,冠軍的背後是一群人的努力和奉獻。
團隊目前有三位指導教師,其中兩位老師身經百戰、曾帶領團隊多次拿下冠軍:翟季冬老師從2014年就開始指導比賽、韓文弢老師則是從2016年開始指導。 
另外團隊成員如張晨、陳嘉傑、王雨田、宋澤宇、翟明書都參加過同樣具有很高含金量的超頻比賽ISC20並取得了很好的成績;
「團隊的選拔和培養主要以興趣為主,我們其實是一個興趣團隊。」翟季冬介紹到,「同學們在日常培訓中會表現出不同的興趣,有人對硬體感興趣,對程式優化和程式分析方面有很大的發揮空間……我們會在比賽中極力去發掘和培養他們的這些興趣。」
清華大學超頻團隊在本學期學生返校後立即開始進行賽前訓練準備,因為經歷了半年疫情,導致隊伍磨合不足,不過這個問題在團隊緊鑼密鼓的訓練之後被逐漸地克服了。
圖註:比賽現場
遠程比賽帶來了時差問題,另外比賽規則改變帶來的新挑戰及臨場的各類技術難題等各方面困難,饒是實力超群的清華超頻團隊解決起來也是下了很大功夫。

「我們常說超頻比賽就像F1方程式賽車,是非常綜合的一個比賽。不僅要擁有先進的硬體設備,同時還需要隊員們對相關科學領域的應用有深刻的理解,在高性能計算方面有紮實的基本功,極佳的現場應對策略及語言表達能力等等。」
指導教師韓文弢介紹到。
連續72小時作戰引起的疲勞是比賽很大的攔路虎,團隊成員太困太累了就只能在現場稍作休息。

最終,憑藉全面的綜合能力、穩定的現場發揮和精準的資源調度,清華超頻團隊又一次拿下了總冠軍。 

團隊中的每位成員都有自己的特長,特別是擔任隊長的張晨同學,她憑藉各方面出色的綜合能力在前不久的清華本科生特等獎學金答辯中成功入選。

在2018年時,張晨就曾跟在清華超頻團隊參加真實的比賽訓練…
到了2019年秋天,她作為超頻團隊核心一員,參加了在美國舉辦的SC19世界大學生超級電腦競賽,戰勝了7個國家的16支電腦強校隊伍,和老師同學一起為清華拿下了世界冠軍。

清華大學學生超頻團隊在SC19 頒獎典禮上領取冠軍獎牌,右四為張晨同學。(圖源清華大學新聞網)

清華大學學生超頻團隊在SC19 決賽現場 圖源清華大學新聞網
清華大學電腦系從2012年組建超頻團隊至今,共組織參加了20餘次國際賽事,奪得十幾次冠軍。由於在高性能計算、並行系統和電腦系統等方面所具有的完整教學體系,清華大學電腦係為團隊的建設給予了充分支援,同時積累了良好的梯隊建設經驗。指導教師翟季冬在超頻領域所取得的多項科研成果,也對團隊的多次奪冠有所幫助。
2018年時任隊長於紀平曾說,通過參加比賽,同學們接觸到了世界上最先進的硬體,比賽題目都是真實的科學計算應用,這更增進了自己的實踐能力。

超頻比賽對於本科教學是很好的擴展和補充。電腦係為本科同學設置了《編譯原理》《高性能計算導論》等超頻領域相關的專業選修課程,為同學們了解超頻相關理論打下基礎。團隊通過訓練研究比賽題目中的眾多真實的科學計算程式,更好地鍛煉了同學們的動手實踐能力,實現理論與實踐的緊密結合。

通過參加超頻比賽,本科畢業後不少同學選擇在超頻領域繼續走下去~

參考鏈接:
//sc20.supercomputing.org/
//mp.weixin.qq.com/s/iW_AEAE–pn1iuYAjltvNA


推薦閱讀

 

點擊閱讀原文,直達AAAI小組!