7大雲計算數據倉庫
- 2019 年 10 月 7 日
- 筆記
頂級雲計算數據倉庫展示了近年來雲計算數據倉庫市場發展的特性,因為很多企業更多地採用雲計算,並減少了自己的物理數據中心足跡。
雲計算數據倉庫是一項收集、組織和經常存儲供組織用於不同活動(包括數據分析和監視)數據的服務。
在企業使用雲計算數據倉庫時,物理硬體方面全部由雲計算供應商負責。對於只看到大量等待數據並可供處理的大型倉庫或數據倉庫的最終用戶來說,它們是抽象的。近年來,隨著越來越多的企業開始利用雲計算的優勢,並減少物理數據中心,雲計算數據倉庫的市場不斷增長。
雲計算數據倉庫通常包括一個或多個指向資料庫集合的指針,在這些集合中收集生產數據。雲計算數據倉庫的第二個核心元素是某種形式的集成查詢引擎,使用戶能夠搜索和分析數據。這有助於數據挖掘。
如何選擇雲計算數據倉庫服務
在尋求選擇雲計算數據倉庫服務時,企業應考慮許多標準。
現有的雲部署。每個主要的公共雲提供商都擁有自己的數據倉庫,該倉庫提供與現有資源的集成,這可以使雲計算數據倉庫用戶更輕鬆地進行部署和使用。
遷移數據的能力。考慮組織擁有的不同類型的數據及其存儲位置,有效地將數據遷移到新數據倉庫中的能力至關重要。
存儲選項。雖然數據倉庫解決方案可以用於存儲數據,但能夠訪問商品化的雲存儲服務,可以提供更低的成本選擇。
在行業媒體Datamation列出的頂級公司列表中,重點介紹了可以提供頂級雲計算數據倉庫服務的供應商:
(1)Amazon Redshift
潛在買家的價值主張。隨著亞馬遜公司進入雲計算數據倉庫市場,對於那些已經在AWS工具和部署方面進行投資的組織來說,Redshift是一個理想的解決方案。
關鍵價值/差異:
•Redshift的主要區別在於,憑藉其Spe ctrum功能,組織可以直接與AWS S3雲數據存儲服務中的數據存儲連接,從而減少了啟動所需的時間和成本。
•用戶強調的優勢之一是Redshift的性能,它得益於AWS基礎設施和大型並行處理數據倉庫架構的分布查詢和數據分析。
•對於S3或現有數據湖之外的數據,Redshift可以與AWS Glue集成,AWS Glue是一種提取、轉換、載入(ETL)工具,可將數據導入數據倉庫。
•數據倉庫的存儲和操作通過AWS網路隔離策略和工具(包括虛擬私有雲(VPC))進行保護。
(2)Google BigQuery
潛在買家的價值主張。對於希望使用標準SQL查詢來分析雲中的大型數據集的用戶而言,BigQuery是一個合理的選擇。
關鍵價值/差異:
•作為完全託管的雲計算服務,數據倉庫的設置和資源供應均由Google公司使用無伺服器技術來處理。
•通過SQL或通過開放資料庫連接(ODBC)輕鬆查詢數據的能力是BigQuery的關鍵價值,它使用戶能夠使用現有的工具和技能。
•BigQuery中的邏輯數據倉庫功能使用戶可以與其他數據源(包括資料庫甚至電子表格)連接以分析數據。
•與BigQuery ML的集成是一個關鍵的區別因素,它將數據倉庫和機器學習(ML)的世界融合在一起。使用BigQuery ML,可以在數據倉庫中的數據上訓練機器學習工作負載。
(3)IBM Db2 Warehouse
潛在買家的價值主張。對於處理分析工作負載的組織來說,IBM Db2 Warehouse是一個很好的選擇,它可以從平台的集成記憶體資料庫引擎和Apache Spark分析引擎中獲益。
關鍵價值/差異:
•集成了Db2記憶體中的列式資料庫引擎,對於正在尋找包含高性能資料庫的數據倉庫的組織而言,這可能是一個很大的好處。
•Apache Spark引擎也與Db2集成在一起,這意味著用戶可以針對數據倉庫使用SQL查詢和Spark查詢,以獲取見解。
•Db2 Warehouse受益於IBM的Netezza技術以及高級數據查找功能。
•可以在IBM雲平台或AWS雲平台中完成雲部署,並且還有本地版本的Db2 Warehouse,這對於具有混合雲部署需求的組織很有用。
(4)Microsoft Azure SQL Data Warehouse
潛在買家的價值主張。Microsoft Azure SQL數據倉庫非常適合任何規模的組織,這要歸功於與Microsoft SQL Server的集成,希望可以輕鬆地將基於雲計算的數據倉庫技術引入。
關鍵價值/差異:
•微軟公司在2019年7月發布了Azure SQL數據倉庫的主要更新,其中包括Gen2更新,提供了更多的SQL Server功能和高級安全選項。
•動態數據屏蔽(DDM)提供了非常精細的安全控制級別,使敏感數據可以在進行查詢時即時隱藏。
•現有的微軟用戶可能會從Azure SQL數據倉庫中獲得最大的收益,因為它跨Microsoft Azure公共雲以及更重要的是用於資料庫的SQL Server具有多種集成。
•與僅在本地運行SQL Server相比,微軟建立在龐大的並行處理體系結構上,該體系結構可使用戶同時運行一百多個並發查詢。
(5)Oracle Autonomous Data Warehouse
潛在買家的價值主張。對於Oracle資料庫的現有用戶而言,Oracle自主數據倉庫可能是最簡單的選擇,它提供了一個連接到雲端的入口。
關鍵價值/差異:
•Oracle的主要區別在於,它在優化的雲計算服務中運行自主數據倉庫,該服務運行Oracle的Exadata硬體系統,該系統專門針對Oracle資料庫而構建。
•該服務集成了基於Web的筆記型電腦和報告服務,以共享數據分析並實現輕鬆的協作。
•雖然支援Oracle自己的同名資料庫,但用戶還可以從其他資料庫和雲平台(包括Amazon Redshift)以及本地對象數據存儲中遷移數據。
•Oracle的SQL Developer功能是另一個關鍵功能,它集成了數據載入嚮導和資料庫開發環境。
(6)SAP Data Warehouse Cloud
潛在買家的價值主張。SAP Data Warehouse Cloud可能非常適合那些希望通過預先構建的模板尋求更多交鑰匙方法來充分利用數據倉庫的組織。
關鍵價值/差異:
•SAP Data Warehouse Cloud是該領域相對較新的參與者,它是在5月的2019 SAPPHIRE NOW會議上首次發布的。
•SAP的HANA雲服務和資料庫是數據倉庫雲的核心,輔以數據治理的最佳實踐,並與SQL查詢引擎集成。
•該平台的主要區別在於集成了預先構建的業務模板,這些模板可以幫助解決特定行業和業務線的通用數據倉庫和分析用例。
•對於現有的SAP用戶,與其他SAP應用程式的集成意味著可以更輕鬆地訪問本地以及雲計算數據集。
(7)Snowflake
對潛在買家的價值主張。對於需要為數據倉庫功能選擇不同的公共雲提供商的任何行業的組織而言,Snowflake是一個很好的選擇。
關鍵價值/差異:
•關鍵區別在於Snowflake的列式資料庫引擎功能,該功能可以處理JSON和XML等結構化和半結構化數據。
•解耦的Snowflake架構允許計算和存儲分別擴展,並在用戶選擇的雲提供商上提供數據存儲。
•系統創建Snowflake所謂的虛擬數據倉庫,其中不同的工作負載共享相同的數據,但可以獨立運行。
•通過標準SQL進行查詢,以進行分析,並與R和Python程式語言集成。
7個頂級雲計算數據倉庫對比圖表

(來源:企業網D1Net)