重寫邊緣計算的災難恢復計劃

  • 2019 年 10 月 7 日
  • 筆記

系統和應用程序分散在企業和雲中的時代,IT領導者必須重新考慮其災難恢復計劃。

多年以來,編寫災難恢復計劃一直是IT部門的責任,但是現在必須重新調整這些計劃,以針對邊緣計算和雲計算環境進行故障轉移。有哪些新功能?組織如何修改其計劃?

規則1:IT團隊無法控制邊緣計算

考慮到採用了邊緣計算和其他分佈式計算策略,IT團隊不能使用圍繞數據中心構建的標準集中式災難恢復計劃來控制所有這些分佈式計算。例如,在使用機械人技術和自動化進行的日常製造中,由生產線主管和製造人員來運行機械人,並負責確保這些資產在不使用時在鎖定區域內安全可靠。在許多情況下,這些製造人員還可能自己安裝和監視/維護設備,或與供應商合作。這些人員在安全性或資產保護以及維護/監視方面沒有IT背景。同時,在IT之外安裝新的邊緣計算網絡和解決方案會使可能發生故障的IT資產數量成倍增加。需要在某個地方記錄災難恢復和故障轉移計劃並對其進行培訓,以便涵蓋這些資產。發生這種情況的最合邏輯的地方是在IT 災難恢復和業務連續性計劃中。

要修改該計劃,IT團隊必須與這些不同的分佈式計算小組開展合作。關鍵是讓每個人都參與進來,並致力於記錄災難恢復和故障轉移計劃,然後定期參與和測試。

規則2:雲計算應用意味着雲計算災難恢復交付

在2018年,Rightscale公司對近1,000名IT專業人員進行了調查,發現他們所在公司採用的雲平台平均數量接近4.8個。

有趣的是,會有多少個公司記錄了災難恢復程序來處理雲平台的中斷。當專家查看客戶使用的雲計算供應商時,就想到了這個問題,發現幾乎所有雲計算供應商的合同中都有條款,如果發生災難,採用這些條款可以免除責任。

要點:如果企業的IT部門尚未這樣做,則應將其合作的每個雲計算供應商都寫入災難恢復計劃中。供應商承諾進行備份和恢復的服務等級協議(SLA)是什麼?如果出現故障,企業(或其供應商)的災難恢復計劃是什麼?企業是否與供應商達成協議,以每年測試企業在雲上用於災難恢復故障轉移的應用程序?

規則3:人身安全很重要

企業的IT團隊越傾向於邊緣計算,找到進入生產工廠或現場辦公室的途徑,物理安全就越來越與災難恢復聯繫在一起。如果偏遠沙漠地區的現場辦公室過熱,服務器出現故障怎麼辦?或者未經授權的員工進入製造工廠的重要區域並篡改機械人的操作該怎麼辦?企業的災難恢復計劃應包括在分佈式物理位置(而不僅僅是在中央數據中心)對設備和設施進行定期檢查和測試。

規則4:災難恢復通信必須變得更好

幾年前,一家銀行的數據中心所在地發生了一次地震,IT部門停機中斷,雖然數據中心受到的損害很小,但是整個區域的網絡和通信都已中斷,因此分支機構的員工必須通過保留人工分類帳來處理客戶交易,以便在系統服務返回時將其輸入系統。

在這段時間裏,客戶詢問一名櫃員出了什麼問題,她表示,「我們的服務器都受到了影響。」這個消息在整個社區和媒體中廣泛傳播,很多客戶蜂擁而至,試圖關閉賬戶。

當更多的人控制IT資產(例如邊緣計算)時,這種情況會加劇。這就是為什麼擁有良好的溝通如此重要的原因,它解釋了在災難中誰與誰溝通了什麼內容,與誰溝通,並且每個人都堅持這樣做的原因。

通常,溝通行為應該是企業的公共關係團隊實施。該團隊與高層管理人員進行協調,並向社區和媒體發佈有關災難的聲明。

如果在員工心中沒有牢固地建立和鞏固這種溝通渠道,那麼企業可能會發現與實際的災難相比,企業將更多的時間花在從錯誤的溝通中進行災難恢復上。

規則5:災難恢復必須適用於多個地區

隨着邊緣計算和遠程辦公室的興起,毋庸置疑,災難恢復不能集中在一個位置或數據中心。特別是如果企業將雲計算用於災難恢復,需要選擇具有多個地理位置的雲計算提供商。這樣可以在主數據中心或雲計算數據存儲位置發生故障的情況下,將故障轉移到正常運行的位置。這些故障轉移數據中心方案應包括在災難恢復計劃中並對其進行測試。

規則6:必須重新校準災難恢複測試計劃

如果企業要將更多的IT交付給雲計算,並部署更多的邊緣計算,則應將新的災難恢複測試方案添加到企業的計劃中,以確保針對所有這些新位置進行災難恢復文檔和測試。企業想知道其災難恢復必須適用於所有公司的災難恢復方案。

規則7:首席代表必須為災難恢復提供更多的口頭服務

向雲計算和邊緣計算的遷移使災難恢復變得複雜。這意味着大多數組織都需要審查和修訂其災難恢復計劃。對於大多數組織而言,災難恢復和評審和修訂需要花費時間,而這並不是大多數組織的工作重點,而且往往落後於需要退出的大量項目。由於雲計算和邊緣計算技術給IT帶來的變化,首席信息官需要向管理層和董事會說明這些變化對災難恢復的影響,以及需要投入精力和時間修改災難恢復計劃。

規則8:邊緣計算和雲計算供應商參與災難恢復應該確保安全

如前所述,大多數雲計算供應商在合同中並未對災難恢復和故障轉移給予太多保證。在與雲計算供應商簽署合同之前,供應商災難恢復承諾和支持應成為招標書的一部分,也是重要的討論點。

規則9:網絡冗餘至關重要

許多組織將重點放在災難發生時的系統和數據恢復上,而很少將重點放在網絡上。但是,考慮到當今全球互聯網和廣域網的作用,網絡災難恢復故障轉移和冗餘也應該內置到災難恢復計劃中。

(來源:企業網D1Net)