超融合超越企業傳統存儲繞不開的六個問題
- 2019 年 10 月 29 日
- 筆記
在虛擬化及雲計算技術大規模應用於企業數據中心的科技浪潮中,存儲性能無疑是決定企業核心應用是否能被虛擬化、雲化的關鍵考量指標之一。傳統的做法是升級存儲設備,從低端、中端到高端存儲,但這沒解決根本問題,性能和容量仍不能兼顧,並且不能很好的解決異構設備利舊和架構擴展的問題。因此,企業需要一種大規模分散式存儲管理軟體,能夠充分利用已有的硬體資源,在可控成本範圍內提供最佳的存儲性能,並能根據業務需求變化,從容量和性能兩方面同時快速橫向擴展。這也是當今軟體定義存儲興起的現實基礎。

超融合架構(Hyperconvergence Infrastructure, 簡稱HCI)將虛擬化計算和存儲整合到同一個系統平台,通過軟體來統一管理。簡單的說就是物理伺服器上運行虛擬化軟體(Hpyervisor),通過在虛擬化軟體上運行分散式存儲服務供虛擬機使用。分散式存儲可以運行在虛擬化軟體上的虛擬機里,也可以是與虛擬化軟體整合的模組。廣義上講,除了虛擬化計算和存儲,超融合架構還可以整合網路以及其他更多的平台和服務,為企業實現可擴展的 IT 基礎架構。
歷史經驗一再表明,由技術進步推動的變革往往以超乎人們想像的速度和烈度發生著。面對新的變革和潮流,在追逐新技術潮流變化的同時,我們還需冷靜思考可能帶來的問題。在企業級數據中心,如何正確認識超融合和傳統存儲?如何能提高性能和降低成本,並可控風險?這些都需要我們從實際出發,辯證和客觀的去看待。
問題一、企業傳統存儲與超融合差別在哪裡?
企業傳統存儲架構最大的問題有如下幾個方面:1.存儲資源集中化,很難隨著計算資源擴展而擴展,無法適應數據中心的這種可靈活擴展的需求。2.採用存儲與計算分離的這種架構,需要獨立的網路、獨立的存儲與獨立的計算。為了提高系統可用性,需要通過資源冗餘的方式達到設計目標。因此,網路、存儲控制器(雙控或多控)都會進行多份冗餘,增加了數據中心的投資。3.多種不同的存儲系統在數據中心中進行部署無疑增加了數據中心的管理複雜度。尤其是後端多種類型的存儲設備,增加了數據中心的管理成本。
採用超融合架構,它明顯的優點是易於擴展,最小部署,按需擴容。具體表現在:1.完全軟體定義。獨立於硬體,採用商業通用標準硬體平台(如X86),完全採用軟體實現計算、存儲、網路等功能。2.實現統一管理。以虛擬化計算為中心,計算、存儲、網路均由虛擬化引擎統一管理和調度,軟體定義屏蔽了以往異構設備的複雜性。3.完全分散式,去中心化。橫向擴展的分散式系統,計算、存儲、網路按需進行動態擴展,系統不存在任意單點故障,採用分散式存儲可實現去中心化。
問題二、傳統存儲與超融合分散式在數據一致性方面的區別
數據一致性是指關聯數據之間的邏輯關係是否正確和完整,可以理解為應用程式運行的數據狀態與最終寫入到磁碟中的數據狀態是否一致。在企業核心應用高並發業務場景下,數據一致性的保障可大大提高系統的可靠性和容錯性。引起數據一致性問題的一個主要原因是位於數據I/O路徑上的各種Cache或Buffer(包括資料庫Cache、文件系統Cache、存儲控制器 Cache、磁碟Cache等)。由於不同系統模組處理數據IO的速度是存在差異的,所以就需要添加Cache來快取IO操作,適配不同模組的處理速度。這些Cache在提高系統處理性能的同時,也可能會「滯留」IO操作,帶來一些負面影響。如果在系統發生故障時,仍有部分IO「滯留」在IO操作中,真正寫到磁碟中的數據就會少於應用程式實際寫出的數據,造成數據的不一致。當系統恢復時,直接從硬碟中讀出的數據可能存在邏輯錯誤,導致應用無法啟動。
首先從快取管理上看,傳統存儲和超融合的分散式快取管理是不一樣的。首先,傳統存儲是集中式快取一致性管理。在這種快取管理模式下,集群中所有節點均不維護本地快取,而是所有節點共享訪問一個集中存放的快取,數據在快取中只有一份副本,不會也不可以出現多份副本。該快取管理架構的優點是天然的快取一致性,因為不存在多個副本,不需要特殊過程來維護快取一致性。對於高端存儲系統而言,該設計的劣勢是快取需要集中放置,需要使用某種外部網路來連接集中的快取,而且提供非同步化的類似IO的訪問方式,編程複雜,難以掌控和優化,需要投入大量成本。
而超融合分散式的快取管理則是集群中的每個節點都有自己獨享的快取,這種情況會給快取一致性管理上帶來極大的複雜性,當然,所獲得的收益便是一旦命中則性能會非常好。所謂對稱式指的是集群中所有節點在快取管理的地位上是均等的,都可以自行控制管理各自的快取。所謂任意關聯,則是指任意節點均可以快取任意數據塊,數據塊大小視不同產品設計靈活而定。因為可以任意快取,所以會導致多個集群節點同時快取有同一個數據塊的多個不同版本的副本,從而導致一致性問題。解決的辦法則是效仿多CPU快取一致性管理方面的思路,採用MESI一致性基本協議及其變種,可以在盡量減少廣播通訊的前提下實現任意關聯分散式快取一致性。該設計的優點是可以充分利用快取空間,劣勢是成本高,因為需要一個低時延的網路來實現MESI協議流量,否則性能將很差;另外,需要一個高速搜索演算法來搜索對應目標數據塊在快取中的位置,必要時引入硬加速比如TCAM等,導致成本再次增加。
還有就是分散式的系統常常受制於CAP定律。CAP定律說的是在一個分散式電腦系統中,一致性、可用性和分區容錯性這三種保證無法同時得到滿足,最多滿足兩個。眾所周知,分散式事務一般採用兩階段提交策略來實現,這是一個非常耗時的複雜過程,會嚴重影響系統效率,在實踐中我們盡量避免使用它。在實踐過程中,如果我們為了擴展數據容量將數據分散式存儲,而事務的要求又完全不能降低。那麼,系統的可用性一定會大大降低,在現實中,我們一般都採用對這些數據不分散存儲的策略。
從以上分析來看,傳統存儲與超融合分散式的數據一致性還是有明顯區別的,在具體業務場景中,需要綜合成本、性能、穩定性方面來綜合考量和選擇。
問題三、企業級數據服務的高級功能
目前,在大多數超融合系統和SDS系統都具備了核心的企業級功能,包括數據冗餘、自動精簡配置、快照、克隆、SSD Cache/Tier、數據自動重建、高可用/多路徑等數據功能,但有些高級功能例如重複數據刪除、數據加密、數據壓縮等還是缺失的。相對於高端存儲系統,如果超融合架構要承載核心關鍵應用,還有一些差距,包括但不限於QoS控制、數據保護、數據遷移、備份容災、一致性的高性能。核心存儲系統應該遵循RAS-P原則,先做好穩定可靠性,其次是企業數據功能完備性,最後才是高性能,這個順序不能亂,光有高性能是不行的。
目前超融合架構中,許多兩副本和三副本的解決方案也是在同一個數據中心內或同一POD里,跨數據中心的容災幾乎沒有。還有就是存儲雙活和仲裁,目前VSAN支援存儲雙活,還引入了WITNESS組件。但其他超融合解決方案還沒有支援應用雙活的案例。
對於超融合來說,如果缺少完整可靠的數據服務能力則意味著採用這個解決方案的客戶仍然需要購買額外的存儲系統來填補原有解決方案所缺少的功能。
目前,核心關鍵業務系統還不太敢往超融合架構上遷移,主要還是從非核心業務開始檢驗,畢竟超融合出現時間還比較短,需要更多的時間做實踐驗證。但是,我們有理由相信未來超融合必定是可以支援核心關鍵業務的主流架構。
問題四、如何進行數據生命周期管理
隨著企業業務發展以及各種平台、系統的建立,這意味著需要管理的數據量越來越龐大,資源維護成本越來越高,效率越來越低。那麼,面對企業對數據的不同時效、不同訪問頻率、不同重要性等要求,如何降低數據存儲和使用維護成本,對不同數據進行生命周期管理是非常有必要的。
結合業界的相關標準規範,企業需要對IT系統的數據進行必要的歸類。目前,根據系統的業務特點,比較流行的數據歸類包括:生產交易型數據、服務支撐型數據與系統日常數據三部分。
根據數據歸類,不同類別的數據應匹配不同的數據存儲策略。數據存儲策略就是將不同的數據存放在指定的存儲設備上。目前,主要的存儲設備主要分成在線存儲、近線存儲、離線歸檔存儲這三種常用存儲。
在傳統企業存儲中,通過分級存儲策略,根據數據不同的重要性、訪問頻次等指標把數據分別存儲在不同性能的存儲設備上,並採取不同的存儲方式。這樣一方面可以大大減少非重要性數據在一級本地磁碟所佔用的空間,還可加快整個系統的存儲性能。
對於超融合分散式存儲來說,目前還未充分考慮到數據生命周期的管理,對於冷熱數據雖然也有存儲區域上的區分,但基本都是拿閃盤來做快取加速,還不能有效做到分級存儲,來滿足企業對於大量不同數據的精細化管理和生命周期管理。
問題五、企業傳統存儲與超融合是對立還是共存互補?
傳統企業的IT一般都經過了若干年的發展,形成了自己特有的基礎架構和硬體設施。企業採購的伺服器、存儲等IT資源都是固定資產,往往希望將淘汰或過保的這些資源進行利舊,從而達到保護投資的目的。而且在企業中,還有相當一部分的傳統IT應用仍然運行在物理伺服器和傳統存儲系統之上。我們可以樂觀地認為沒有哪一種應用程式不能被部署在超融合基礎架構上,但是考慮到運行效率、硬體依賴性以及和虛擬化環境兼容性等因素,很多IT應用最好還是繼續保持運行在物理硬體架構,比如關鍵資料庫應用、實時控制系統以及大量遺留IT系統。當然許多業務場景,需要靈活的擴展性和彈性配置,也非常適合超融合的架構,我們也會根據需求來決定是否採用超融合解決方案。
大多數的超融合解決方案都希望數據中心可以「完全投入」,即用超融合解決方案自帶的基礎架構和流程替換數據中心現有的存儲硬體、基礎架構和流程。他們通常希望數據中心摒棄共享式集中存儲硬體,而支援商業化的超融合架構。這種想法有點激進,容易讓超融合站在傳統存儲的對立面,而又不能解決實際的問題。企業級數據中心的演變一定是一個漸變的過程,所以企業傳統存儲與超融合不是對立的關係,而是共存和互補的關係,只有面對企業現實場景和具體問題,各自發揮自己的優勢和特長,解決問題才是達到真正的和諧與共贏。
問題六、與同類廠商比,缺少合理的計價模式
超融合解決方案大部分按照容量包獲得許可。許多軟體還針對高級功能收取額外費用。這就造成了一個問題,因為大部分數據中心從來都不能確定自己合適的容量限點來充分利用容量打包價格的優勢。例如,一個初級容量包可提供5-10TB的存儲服務,更高一級的容量包則支援10-25TB。如果企業需要12TB存儲容量怎麼辦?這就意味著企業為了支援多出的2TB的容量,必須升級到25TB的容量許可。其實根據容量來算多少錢,這個方法並不公平。如果按能提供多少個IOPS來算錢?這個才比較公平。這兩種方法實際上有差別,第一個,全快閃記憶體這個性價比非常的高。但是,這個價格也比較高,是混合型的3倍,很多用戶接受不了這樣高的價值。很多用戶還是希望容量和性能的匹配。
另外大部分超融合解決方案都會忽視的另一項成本是:不支援現有基礎架構和存儲系統所產生的相關成本。這樣在實現異構統一管理的過程中,還需開發相應的介面和API,這些隱形成本也是一筆不小的開支。
基於超融合未來良好的發展前景,各廠商也紛紛推出了超融合一體機產品。這種一體機很明顯的優勢就是降低了成本,簡化了部署,提高了可用性,加快了業務上線時間,但也有擴展性和兼容性方面的一些問題。因此,還需結合企業特點做深度訂製並針對不同的業務場景進行性能優化,充分利用它的計算、存儲、網路融合的硬體架構優勢和分散式存儲高吞吐、高IOPS的特點,進一步整合高速網卡、SSD快閃記憶體等硬體的優異性能,從而使得產品整體性能相比業界同類平台得以大幅提升,滿足不同行業的需求才更有市場。
超融合的未來
隨著雲服務的崛起,比較精準的VM管理、系統級QoS,數據分析和挖掘都是未來的增值重點。未來5-10年,新一代數據中心基礎架構會朝著軟體定義和超融合方向發展,SAN/NAS存儲逐漸被軟體定義的存儲所替代,超融合架構將成為數據中心基礎架構的核心。雖然現階段超融合還有許多問題,但是不妨礙它的優秀。同時,我們看到超融合是一個不斷演進的架構,是一個充滿生機和活力的商業模式,未來潛在的市場空間巨大,在未來也會發展的更好!