對話SCC21冠軍團隊!清華的「四連冠」,也是他們的「第一冠」

  • 2021 年 11 月 23 日
  • AI

作者 | 王

編輯 | 青暮
11月15日至11月17日,SC21國際大學生超級計算機競賽在聖路易斯舉辦。
清華大學計算機系新一屆超算團隊再次摘得總冠軍。這也是清華繼SC18、SC19、SC20後拿下的四連冠
總分排行榜中,清華排名第一,上科大次之,南科大第三。同時,南科大獲LINPACK基準測試最高性能獎。
據了解,今年共有十隻隊伍參加比賽,他們分別來自:
  • 克萊姆森大學(Clemson University)

  • 佐治亞理工學院(Georgia Institute of Technology)

  • 波士頓大學、波士頓學院、麻省大學羅維爾校區聯隊(Boston Univ., Boston College, Univ. of Mass. Lowell)

  • 北京大學(Peking University )

  • 上海科技大學(ShanghaiTech University )

  • 南方科技大學(Southern University of Science and Technology )

  • 加利福尼亞大學聖迭戈分校(University of California, San Diego)

  • 維克森林大學(Wake Forest University)

  • 暨南大學(Jinan University)

  • 清華大學(Tsinghua University)

(組委會順序)


1

賽事介紹
全球超級計算大會(Supercomputing Conference,簡稱SC)是國際超算領域的頂級會議,國際影響力巨大。國際大學生超級計算機競賽(SCC)成立於 2007 年,是超級計算機領域的頂級賽事,今年是舉辦該競賽的第15個年頭。
受新冠疫情影響,此次比賽與去年一樣線上進行,可遠程參與。
作為Students@SC計劃的一部分,SCC旨在將學生引入高性能計算社區,推動世界各地區超算青年人才交流和培養,提升超算應用水平和研發能力。比賽吸引了來自世界各國家和地區的眾多高校參與,與ASC超算競賽和ISC超算競賽並列為世界最具權威性的三大國際大學生超算競賽,給了學生一個在競爭中展示自己專業知識技能的平台。
幾個月前,清華大學學生超算團隊剛奪得了國際大學生超算競賽(ISC2021)總冠軍和LINPACK 基準測試最高性能獎,獲得雙料冠軍。


2

清華團隊介紹

代表清華參加此次SCC隊伍由6名清華大學計算機系的本科生組成。由於賽事規定參賽隊員必須是本科生,因此團隊組成相較去年有了較大的變動,其中有四名隊員是新成員。對新成員而言,這是他們第一次參加該項賽事,但也是一戰即勝。
團隊人員如下:
  • 翟明書(隊長)大四 獲得過 SC20 ISC21 冠軍

  • 宋澤宇 大四 獲得過 SC20 ISC21 冠軍

  • 融凱源 大四 新隊員

  • 任彥羽 大三 新隊員

  • 曹雋誠 大三 新隊員

  • 朱昱熹 大三 新隊員

指導教師為清華大學高性能所的翟季冬韓文弢老師。


3

變動的是團隊成員,不變的是團隊精神
在得知清華大學學生超算團隊在該項賽事中獲得四連冠後,AI科技評論聯繫到了他們,並同他們針對比賽情況進行了交流,對話內容整理如下。
  • 「今年的比賽「氛圍感」更足了」
在談到今年SCC整體上和去年以及往年有什麼不同時,清華超算團隊表示今年賽事和去年都是以線上的形式進行的,線下比賽需要參賽者自行搭建物理比賽集群,線上比賽則需要選手合理選擇雲服務資源。
「今年和去年對比,今年的比賽「氛圍感」更足了。主辦方提供了在線交流平台,在比賽中,各個隊伍間、參會人員和隊伍間都可以方便地進行交流互動,讓我們感覺彷彿在線下參加比賽,體驗很好。」
  • 比賽設置繼承往年特點,但也有推陳出新
和往年一致,今年的賽題設置同樣考察了選手對經典HPC應用的編譯、運行、分析、優化能力。
大賽賽題包括基準測試程序LINPACK HPCG IO500,多尺度心臟模擬 Cardioid,量子材料模擬Quantum ESPRESSO,SC20論文復現題以及現場公布的神秘應用「高能中微子物理中的圖像分類應用Cosmic Tagger」
三大基準測試程序中,Linpack 基準測試是計算機浮點執行率的度量。它是通過運行一個計算機程序來確定的,該程序求解了一個密集的線性方程組。它被TOP 500用作對峰值性能進行排名的工具。
高性能共軛梯度 (HPCG) 基準測試項目旨在創建一個用於對 HPC 系統進行排名的新指標。HPCG旨在作為高性能LINPACK(HPL)基準測試的補充,該基準測試目前用於對TOP500計算系統進行排名。
除此之外,IO500 基準測試是高性能 IO 的基準測試套件。它利用現有和受信任的開源基準測試(如 IOR 和 MDTest),並捆綁執行規則和多個工作負載,目的是評估和分析各種 IO 模式的存儲設備。
清華超算團隊認為LINPACK HPCG IO500是每年不變的必考項目,已經比較熟悉了。
多尺度心臟模擬器 Cardioid是一款用於模擬臨床心臟現象的心臟模擬套件。它能夠模擬電生理和機械器官級模擬,並具有用於計算心臟網格,重建軀幹ECG和生成逼真的心臟纖維方向的處理工具。,曾在 SC12 入選 Gordon-Bell 獎的 Finalist。
Quantum ESPRESSO 也是一個經典的科學計算軟件,在材料等學科有着廣泛使用,屬於超算上的經典應用,也曾在幾年前的 ASC 比賽中出現過。
在復現題中,選手需要承擔審查SC20論文的角色。SC21復現題委員會選擇了論文 「A Parallel Framework for Constraint-Based Bayesian Network Learning via Markov Blanket Discovery」 作為今年SCC復現題基準。
「我們需要復現實驗結果,並分析與原論文數據間的異同。」
團隊成員表示:兩道應用Cardioid和Q-E都是在超算中心上投入使用很多年的程序,組委會通過賽題,不僅考察了隊員的各方面能力,也讓我們有機會了解認識到真正的超算中心上都在解決哪些問題。
「去年比賽是第一次線上競賽,我們需要在預算限制下,在 Azure 雲服務器上自選機型,搭建高性能集群進行比賽。」
不同的是,此次大賽首次提供微軟 Azure 雲和Oracle雲兩個雲平台供學生進行比賽。學生團隊必須優先考慮和利用 Microsoft Azure 雲的預算,並且需要了解如何優化和利用Oracle雲提供的特定硬件。這對選手來說是一個新的體驗。
「雲服務器的特點在於機型種類多,有不同的軟硬件配置。在選擇機型時,我們不僅需要在權衡性價比後選擇最合適的硬件配置,還要為它們安裝正確的軟件(如操作系統等),才能發揮出它最高的性能。這要求同學們必須對軟硬件有深入的了解。」
  • 冷靜分析,沉着應對,終得冠軍
「在比賽中,我們也遇到了一些資源競爭的問題。開賽後我們才發現,某種高性能機型主辦方只提供了8台,甚至不能保證10個隊伍各有一台。高性能機型的不足,是我們本次比賽中遇到的最大困難。最終我們調整策略,順利完成了比賽。」
團隊成員翟明書、宋澤宇曾參加過ISC21,SC20,ASC21並且取得了很好的成績。今年隊伍中雖有4名同學都是第一次參加,但是他們仍然保持了高水平的發揮。這離不開每個隊員賽前的刻苦訓練,以及賽中充分的交流協作。
「要想把比賽打好,我們需要發揮出每個隊員的長處,合理安排比賽策略,在比賽中做到高效交流、冷靜判斷比賽形勢。今年我們做到了這些,也取得了一個好成績。」
雖然清華超算團隊已經在SC比賽上取得了四連冠的傲人成績,在外人看來可能會覺得清華奪冠不是一件特別困難的事情,但事實並非如此。
「超算比賽只允許本科生同學參賽,所以我們每年隊伍人員變動都不小。SC比賽是每年秋季開學後的第一場超算比賽,對很多超算隊隊員而言,SC比賽都是他們經歷的第一場超算比賽。第一次參賽總是最具有挑戰的,想要在比賽中有好的發揮,離不開賽前充分刻苦的訓練。」
清華的「四連冠」,但對新隊員來說是「第一冠」,這絕對不是輕而易舉就可以做到的。
「我們希望這是一個好的開始,在接下來的ISC等超算競賽中,爭取獲得好成績。」

參考鏈接:

1.//sc21.supercomputing.org

2.//studentclustercompetition.us/index.html

雷峰網雷峰網