《同心協契,砥礪前行》-2019年騰訊數據中心技能爭霸賽
- 2020 年 1 月 3 日
- 筆記




騰訊數據中心技能爭霸賽
We Are Champions
2019年12月20日,第二屆「騰訊數據中心技能爭霸賽」總決賽,在深圳騰訊濱海大廈圓滿落下帷幕。7支參加總決賽的隊伍(共28人)從全國數百餘位IT工程師中脫穎而出,角逐最終團體總冠軍和四個單項冠軍(伺服器、網路、資產、安全)。






「數據中心技能爭霸賽」是騰訊數據中心一線運維團隊每年一度的技術盛會。今年,我們在上屆大賽的基礎上進行了賽制升級。不僅增加了「安全」這個全新競賽單元;而且還將「伺服器」、「網路」、「資產」、「安全」這四個競賽單元,融合在一整個實操比賽中,來考驗參賽團隊的聯合作戰能力。
同時,在考點的設置上緊跟實際運營需求,將騰訊雲伺服器運維、雲網路排障、部件資產管理、數據中心運營安全等實際工作場景中的重點和難點巧妙的融入到比賽中;既考驗了選手們解決日常實際問題的能力,也考驗了選手們相關知識的深度與廣度。
● 比賽集錦●
數據中心安全技能比賽
數據中心運維,安全永遠是放在首位的。無論是人身安全、資訊安全、資產安全還是操作安全,每一項都不容忽視!
猜猜看,我們的考官給選手們出的安全考題是什麼,讓我們的選手一進機房就弄得一頭霧水?

原來是「人員機架觸電急救」——模擬有人在機房觸電後如何處理。
喂喂喂,這位選手,你就直接這樣開始去救人么?是不是忘了點什麼?瞧把旁邊的小姐姐急的。

劃重點啦:首先應迅速切斷電源或通過絕緣體將觸電人員與帶電體隔離。救人雖然緊急,但也需要先保護好自己。

現在,再開始按照心肺復甦的八步法則實施搶救吧!(PS:最後一位兄弟,你也是夠投入的呀!)
伺服器技能比賽
從2018年起,騰訊開始大規模使用自研伺服器,這些伺服器是根據騰訊業務特性進行專項設計,再委託代工廠製造。代工廠的優勢在於生產,其並不具備設備的維保能力。海量自研伺服器的維保重任便落到了數據中心運維團隊的肩上。
今年的大賽,伺服器的考官們,不單單關注選手們硬體的維修能力,還將OS和網路聯調一併納入到考點中,共計設置了4個硬體故障和3系統故障考點。
這位小哥哥,直接從硬體入手,一番「望聞問切」後,找到了故障點,美中不足的是用時較長。

下面這位選手一看就是「老司機」,剛到機房就用自己的筆記型電腦連接到伺服器的帶外埠,通過查看BMC日誌,讓真相水落石出。

面對複雜的故障場景,一個人搞不定?嗯,趕緊叫小夥伴來幫忙。人多力量大,這次我們玩的是團戰。

此外,關於系統和網路聯調排障,考官選擇了在雲架構中常用的網路Bonding這個場景來考驗選手。系統中網卡的配置文件異常,交換機的埠速率設定,伺服器的路由指向,這些問題點單個拿出來,可能都不會對我們這些全國精英構成挑戰;但是在時間的壓力下,同時疊加三個故障點,讓很多選手鎩羽而歸。
網路技能比賽
網路方面的比賽,更是一波三折。選手們看到第一個賽題,心中一陣竊喜——居然是交換機更換。沒錯,技術上的確沒有難度,考的是大家的速度和規範。網路故障處理,早一分鐘恢復,早一分鐘減少對用戶的影響。
於是,馬不停蹄到機房確認故障機的資訊;飛奔到庫房找資產小姐姐領用備機;立馬回到辦公室開始刷機導配置……一氣呵成的背後是多年一線戰鬥經歷的縮影。

然而,真正的考驗在第二道試題,請聽題:
請修改設備配置使得兩台交換機的bgp協議能正常建立,同時伺服器最終要能ping通TEST-02的loopback100口。並針對上述案例輸出一個故障案例復盤報告。
小編過期的CCNP水平已經解釋不了這麼高級的話題了。最終的結果是,僅有三支團隊在規定的時間內,完成了網路連通性調試。尤其是來自天津數據中心的隊伍,在4個小伙的共同努力下,在最後一分鐘調通網路。連考官都不由的為他們祝賀!
資產技能比賽
資產管理,是數據中心運維中最容易為人忽視的角色,但隨著自研伺服器投產,資產管理員逐漸成為我們部件運營成本的守夜人。所有伺服器的部件在收發貨時需仔細確認是否有物理損壞。本次大賽除了配合伺服器、網路故障處理進行備件出入庫外,還有一項「尋找部件損壞點」的考驗。
考官們將實際運營中的主板、CPU、陣列卡帶到了賽場,資產管理員們需要在這3個部件中,找到9個物理損壞點。大家一起來試試?

知識搶答比賽
知識搶答比賽,規則看似簡單粗暴,實則考驗各參賽團隊在伺服器、網路、資產、安全等方面專業知識的深度與廣度,還有隊員之間是否能默契配合。在評委考官的各種挖坑下,若不是有真才實學將知識點爛熟於心,分分鐘給其他隊伍送去神助攻。





通過實操比賽,真刀真槍的鍛煉隊伍,讓各運維團隊同台競技;大家在實戰中得到檢驗,看到了自身能力與客戶要求之間的差距,看到了自身水平與行業精英之間的差距;同時,也希望發掘高技術水平人才,鼓勵他們成長為團隊的標杆和榜樣,獲得更多的榮譽和激勵。最後,在團隊內形成持續學習的技術氛圍,打造工匠精神,去打磨技術、研究技術。
一個優秀的數據中心,離不開一個優秀的運維團隊。對數據中心運維人才的培養,我們一直在探索。舉辦這樣的賽事,正是希望培育高水準的一線運維人才,為騰訊各類業務安全穩定的運行保駕護航,為騰訊雲打造一支「招之則來,來之能戰,戰之必勝」的隊伍。
榮耀時刻
Moment Of Glory
●團體冠軍-廣深數據中心聯隊 ●

華南古德陽、覃淑嫻、李仕彬、金凱(左起)
●伺服器技能單項冠軍-曾檢歷 ●

廣州伺服器工程師曾檢歷
●網路技能單項冠軍-李天偉 ●

成都網路工程師李天偉
●資產技能單項冠軍-黃婷婷 ●

成都資產管理工程師黃婷婷
●安全技能單項冠軍-金凱 ●

深圳安全管理員金凱
