2億人在線辦公的瘋狂一夜

前言:不可否認,開工這幾天,已成為在線辦公服務商們的“雙十一”,僅釘釘的流量就遭遇了十幾倍的暴漲。隨着釘釘在2月3日通過阿里雲緊急擴容1萬台服務器後、4日再度擴容1萬台雲服務器,其流量大考還將繼續。企業微信、騰訊會議、華為雲WeLink們都還扛得住么?

契機之下,雷鋒網獨家對話了這些在線辦公服務商的技術團隊以及背後的雲廠商,還原“集體崩潰”後緊急擴容的“瘋狂一夜”。

2月3日上午9時許,誰都沒有預料到,阿里釘釘、企業微信集體遭遇開工視頻即崩潰的消息突然出現,網絡上滿屏都是使用者的吐槽。 

“卡頓?延遲?消息發不出去?不不,這是不應該存在的。”

2億人在線辦公的瘋狂一夜

顯然,由於受疫情影響無法正常運轉,企業用戶對在線辦公系統提出了更高的要求。許多人深刻意識到,流量暴增帶來的雲服務器宕機問題嚴重性,還是在此前的微博“明星熱搜”時代。儘管服務商隨後緊急對雲服務器進行擴容,但這場上億人同時協作的流量高峰還是讓整個在線辦公服務商有些超出預想。

實際上,從正月開始,國內數十家在線辦公服務商就已經進行了免費開放、擴容等調整,激發了用戶數量和視頻並發量的不斷上漲,基於PC端、移動端的視頻調用服務器性能和穩定性正經受非常大的考驗。 

如果未來這種緊急時刻的流量暴增成為常態,那雲服務器宕機就決不能成為常態。

暴漲的用戶量

遠程辦公有多火?據釘釘透露,開工首日,全國就有上千萬企業、近2億人開啟在家辦公模式,“跟雙11之於平時差不多,暴漲十幾倍”。據了解,釘釘將免費視頻會議全量升級至302方免費。 

這一天,企業微信平台上也同時湧入了數百萬企業,是去年同期的3倍,數千萬用戶使用企業微信遠程辦公,同時幾十萬場會議在企業微信召開。

這種勢頭也帶動了年前剛開放的華為雲WeLink。數據顯示,WeLink每日新註冊企業數增長50%,每日會議數增長100%;春節期間新增企業數數十萬,新增日活用戶數超100萬,業務流量增長50倍。

金山辦公旗下WPS+也免費提供了遠程辦公及音頻會議服務,從正月初一開始用戶就開始快速增長。“截止目前,金山文檔的協作用戶增長超過400%,表單、會議等場景化服務增長超過15倍,企業用戶入住增長超過300%。”

而小魚易連也承諾直到疫情結束,將免費開放100方的實時在線會議服務。

城云云際則另闢蹊徑,在開工前兩天,使用抖音快手微視推送免費開放100方雲視頻會議消息,導致了用戶使用量激增。“2月3日當天,數千會議同時召開,萬級的參會者使用雲際會議開會,這給原來我們以視頻會議室為主的模式帶來較大挑戰。” 

阿里釘釘

視頻美顏需求過旺,2天擴容2萬台雲服務器

簡單來說,開工第一天,釘釘遇到了相當於微博上3個明星同時官宣戀情的流量。

儘管提前有所準備,但還是有點始料未及。3號當天早上9點的流量確實有點超出想像,但在緊急調整之後,就穩定下來了。

預案,其實是一切按計劃在走。緊接着當天中午時分,阿里雲放出消息,2小時內緊急擴容1萬台服務器。

但這並不意味着釘釘後台的壓力就完全沒有了,相反,一場大考才剛剛拉開帷幕。 

2億人在線辦公的瘋狂一夜

4日,釘釘再度通過阿里雲擴容1萬台雲服務器,以應對群直播和語音視頻會議的流量洪峰,原來,能夠堅持洗頭、洗臉、化妝的人數較少,導致視頻會議美顏功能需求激增。

擴容是按每天的用量來預估的,現在每天都是暴漲流量,要根據每天增長的情況進行擴容;對阿里雲來說,擴1萬台和擴2萬台,用的時間是一樣的。

如今,釘釘和阿里雲成立專項團隊,24小時輪班倒,全力保障平台穩定。

企業微信

從正月初一就開始擴容,從幾十到幾百倍

如果說此前遠程辦公只是企業辦公的一項充分條件,那麼疫情期間的遠程協作已經成為一種用戶剛需。以雲服務本身彈性伸縮能力為支撐,才得以保障高峰突發需求的滿足。

在延長假期的政策確定後,我們就做了緊急預備方案,但第一天返工高峰期的峰值還是有些超出預期。針對開工當天的突髮狀況,我們在半個小時內做出了緊急修復。

用戶遠程辦公需求很大,並發量進入一個很高的量級,擴容是每天都在做的事情。從正月初一開始,企業微信就一直持續從幾十倍到幾百倍的擴容。

2億人在線辦公的瘋狂一夜

為了滿足高並發以支撐用戶需求,騰訊雲團隊提出了兩個策略:一是在加入、發起會議重要節點保證用戶核心需求,在其他用戶使用頻率不是很高的功能上靈活變化;二是就近接入,分發到邊緣節點,用戶可就近獲得視頻資源。

現如今,團隊每天晚上都要改代碼,進行產品灰度發佈和壓力測試,以滿足第二天用戶開會的需求。

除了企業微信、騰訊會議,騰訊還提供了像文檔、思維導圖、代碼存儲庫、雲盤等工具,疫情下的用戶可能更為集中、流量更為龐大。 

在資源不夠時,樂享可隨時調用騰訊雲的資源,騰訊樂享技術負責人李立博表示。騰訊TAPD技術負責人楊曉俊則指出,在騰訊雲TKE容器彈性伸縮、動態帶寬、COS存儲自動擴容的能力上,TAPD還對TDSQL、Redis、Socket等服務進行了擴容。 

華為雲WeLink

整體功能正常,並未出現崩潰 

我們預測到由於在家辦公的場景下會導致業務量大幅度增加,但實事求是的講,現在的增長速度超出了我們的預期。

業務同樣也遇到了浪涌時的擁塞情況,但整體功能正常,並未出現崩潰的問題。核心在於雲計算本身的彈性伸縮能力和WeLink分佈式的服務架構,得以經受住浪涌業務量的壓力。

2億人在線辦公的瘋狂一夜

現在,華為雲WeLink可支持最大1000方同時視頻會議接入。

金山雲/WPS+

準備了近一倍的冗餘都不夠用

值得一提的是,金山WPS+的雲辦公系統底層資源由金山雲提供,主要支持遠程和協同辦公過程中涉及的海量文件存儲和分發。 

1月26日(正月初二)WPS+表單服務出現了短暫的反應慢,大概持續了45分鐘。主要原因是我們沒有預計到過年期間還會有這麼高增長,準備了近一倍的冗餘都不夠用。事發後,團隊緊急申請擴容。 

期間,北京各機房因疫情面臨封網,人員進出受控,金山雲連夜緊急安排線上存量資源調度,整合北京、上海、廣州各地的BGP帶寬資源。同時遷移整合線上計算資源,以滿足遠程辦公的業務突發和彈性擴容需求,支持海量文件存儲和分發。金山雲可一小時內完成擴容,其背後最大的挑戰是並發處理能力。

從這起事件可以看出,正是因為提前適應了用戶激增帶來的問題,反而讓金山雲在2月3日開工當天並未出現太大問題。

小魚易連、城云云際

新老客戶如何兩手抓?

儘管多數服務商技術團隊對疫情影響下遠程辦公業務量的增長有所預感,但與現實情況相比,還是有些措手不及。

開工上午,曾有用戶反饋小魚易連暫時不能正常運行,可能與免費帶來的訪問量激增有關。針對當天呼叫量數十倍的增長,我們採取了限流措施,優先保障付費用戶群體使用。小魚易連CEO袁文輝解釋。

除了緊急擴容、協調數據中心與運營商帶寬資源外,城云云際還對用戶激增問題進行了強制維護。

城云云際提前在多個數據中心進行擴容,對老客戶與新增客戶正常使用進行保障———我們先後做了兩項重要工作:一是為新用戶製作了快速入會的短視頻指南;二是在緊急擴容的同時,也在引導部分企業客戶使用電話、語音會議等功能。

2億人在線辦公的瘋狂一夜

流量激增背後

整體來看,其實在全國多數企業復工之前,視頻會議的調用量就已經開始上升,尤其以政企疫情工作和在線教育場景最為突出。

“最早在疫情開始後,各級政府、醫院、衛計委等機關單位,需要一個系統能將各地醫院連接起來,用於疫情的管控部署”,小魚易連告訴雷鋒網,“但從正月初一開始,用戶量就開始每天翻倍。尤其是教育,用我們的產品做互動教學,特別是針對初高三的學生,這其實是第二波用戶。”

值得一提的是,早在釘釘對外開放在線直播課堂時,就曾有用戶調侃:“就等大家在釘釘群里直播上課,以後把釘釘都搞崩。”不難看出,前後多重用戶訪問量的疊加衝擊,才是最終引爆視頻卡頓問題的關鍵。

針對疫情期間用戶比較集中的場景上,華為雲WeLink也從自身角度進行了說明:

“一是政府及衛生主管部門疫情工作布置、信息收集、上傳下達,陸續有各地政府部門專門下文使用視頻會議進行工作布置和工作協同。

二是醫療衛生單位,針對當前非發熱病人盡量不去醫院就診情況,開展遠程診療、家庭病房關懷、醫院住院病患進行遠程探視等。

三是學校,針對學生進行健康打卡、在線學習、知識推送等,停課不停學。

四是大企業,利用最大支持1000方並發會議接入進行工作布置,人雖然不能在一起,但企業還要做好應對後續業務開展的準備。”

例如,釘釘為甘肅疫情聯防聯控進行部署,企業微信提供的在線問診、在線教育群直播服務,城云云際為浙江大學、溫州醫科大學提供視頻會議系統。

2億人在線辦公的瘋狂一夜

這或許也是當前在線辦公企業在提供視頻會議服務時所面臨的共同考量。採訪中,類似的說法被不同的服務商或多或少地提及。

線上能否成為未來企業辦公的主流方式?疫情終會過去,在線辦公市場最終會迎來什麼樣的變化?其實,經歷了緊急擴容的瘋狂一夜,雲作為底層資源的重要性被更加凸顯出來,基於雲的在線辦公正打開行業的新局面。你心中,誰又將是這場賽跑的獲勝者?