EMR系列學習心得之創建EMR集群(二)

  • 2019 年 11 月 13 日
  • 筆記

集群是彈性 MapReduce( EMR )提供託管 服務的基本單元,也是用戶使用和管理 EMR 服務的主要對象。本文為您介紹通過騰訊雲官網控制台,快速創建 EMR 集群。

一、前提條件:

1、登錄騰訊雲官網並創建騰訊雲帳號。

2、登錄產品購買頁:

方式一:登錄騰訊雲官網,選擇【產品】>【雲智大數據基礎服務】>【彈性 MapReduce】, 進入 彈性 MapReduce 產品介紹頁,在產品介紹頁,單擊【立即選購】,進入集群創建購買頁。 方式二:直接登錄控制台,選擇產品彈性MapReduce,單擊【新建】進入創建購買頁。

二、創建流程:

在騰訊雲官網自助購買頁面中,僅支援依賴於雲伺服器(CVM)的 EMR 集群創建。如果您需要獨享物理機的黑石 EMR 集群,請通過提交工單 的方式進行提交。

1、搭建準備

創建安全組

安全組在雲端提供類似虛擬防火牆功能,實現對網路埠的訪問控制,是一種重要的安全隔離手段。由於安全組是針對CVM的,所以選擇【產品】>【雲伺服器】>【安全組】進行創建,如下圖:

2、創建集群

可用區與軟體配置

1、計費模式選擇:按量計費、包年包月

關於按量計費與包年包月在雲伺服器單價,配置升降調整等方面的區別,見如下表格的對比:

2、地域、可用區域選擇

目前支援的地域有:廣州、上海、北京。不同地域的雲產品之間內網不互通。

3、產品版本、組件選擇

每個EMR版本對應的組件存在差異,您可以根據業務需求自行選擇,如下圖:

硬體配置

1、 節點高可用選項(默認開啟)

選擇 「啟動高可用」 後,將會默認開啟兩個 Master 節點,至少 3 個 Core 節點,以及 3 個 Common 節點,如下圖:

2、節點規格配置

包括Master節點配置、Core節點配置、Task節點配置、Common節點配置、Router節點配置。各個節點類型、規格說明如下:

  • Master 節點為管理節點,保證集群的調度正常進行。
  • Core 節點為計算及存儲節點,您在 HDFS 中的數據全部存儲於 Core 節點中,因此為了保證數據安全,擴容 Core 節點後不允許縮容。
  • Task 節點為純計算節點,不存儲數據,被計算的數據來自 Core 節點及 COS 中,因此 Task 節點往往被作為彈性節點,可隨時擴容和縮容。
  • Common 節點為 HA 集群 Master 節點提供數據共享同步以及高可用容錯服務。
  • Router 節點用以分擔 Master 節點的負載或者作為集群的任務提交機,可以隨時擴容和縮容。

節點配置包括實例類型、核數、記憶體、磁碟類型及大小,其中實例類型包括:大數據型、記憶體型、高IO型、標準型、計算型。您可以根據自身業務需求進行選擇。

3、集群網路

為保證 EMR 集群的安全性,我們將集群各節點放入了一個私有網路中,您需要設置一個私有網路以保證 EMR 集群的正確創建。

如果現有的網路不合適,您可以去控制台新建私有網路或者新建子網。

基礎配置

1、所屬項目

該集群所在的項目

2、集群名稱

用於區分集群,創建後可以修改

3、對象存儲

開啟後,EMR集群可以讀取分析COS上的數據

4、用戶名密碼

用戶名默認名稱root,可以修改。

EMR 密碼分兩個密碼:"機器登錄密碼" 和 "EMR-UI快捷入口密碼"

機器登錄密碼:如果不使用密鑰登錄,EMR集群中的機器節點,將採用密碼方式登錄。反之將需要密鑰登錄機器,密碼對機器的登錄將失效。

EMR-UI快捷入口密碼:EMR提供了集群UI快捷入口,幫助用戶查看集群各種狀態。快捷入口將採用該密碼進行合法驗證。

完成以上三大步驟後,點擊【購買】,EMR 集群進入創建過程中,在幾分鐘後(大約 10 分鐘)您即可在EMR控制台中找到剛剛創建的集群(集群生產需要一定的時間)。

說明:

若是按量付費集群,集群會立刻開始創建。請耐心等待,集群創建會需要幾分鐘時間。

若是包年包月集群,則會先生成訂單,在支付完成訂單以後集群才會開始創建。