­

如何優雅地恢復運行中的容器應用

本文來自Rancher Labs

作者簡介

鞠宏超,Rancher研發工程師。4年雲計算領域經驗,2018年加入Rancher Labs,先後參與了Longhorn產品研發,Rancher2.x產品研發,目前主要致力於Rancher企業版產品的設計與研發工作。

Longhorn是基於Kubernetes的輕量級分散式塊存儲系統,它完全開源,並且已經捐獻給CNCF。隨著雲原生應用的普及,越來越多的服務提供容器運行時,數據的持久化存儲問題漸漸顯現出來,我們要做的不僅僅是數據的持久化,還要考慮備份的準確性,遷移的複雜性等。

Longhorn提供的分散式塊存儲可以在Kubernetes中直接使用持久化存儲,它可以為數據卷在不同主機提供多副本服務,以保證數據的可靠性,它提供簡潔的UI可以直接管理存儲節點、數據卷,輕鬆實現數據卷的備份/定時備份,您還可以使用容災備份功能,在不同集群創建容災備份卷,並在發生緊急情況時及時進行故障轉移。

在這篇文章中,我們將把MySQL作為Pod部署到集群A中,並使用Longhorn作為持久化存儲卷,然後依託Rancher多集群管理的特性,結合Longhorn的容災備份功能,演示一下如何優雅地將集群A中的MySQL應用及數據遷移到集群B中。

環境準備

  • Rancher (HA部署) – v2.4.8

  • Longhorn(通過Rancher UI Catalog部署) – v1.0.2

  • MySQL – 8

  • 私有S3 – minio部署

  • 業務集群A、B

部署longhorn

在Rancher中,進入集群A的system項目,在應用商店中可以一鍵啟動Longhorn。

等待應用商店部署成功後,可以根據應用商店鏈接進入到Longhorn UI。

接下來,我們在集群B中以同樣方式啟動Longhorn,等待Longhorn正常運行。

創建s3訪問的secret(用於longhorn備份使用)

訪問Rancher,進入集群A的system項目,選擇 資源 > 密文 菜單,在longhorn-system 命名空間中創建訪問s3的secret,需要增加的參數包括:

訪問Rancher,進入集群B的system項目,選擇 資源 > 密文 菜單,在longhorn-system 命名空間中創建與上面相同的secret內容。

配置longhorn backup target

接下來我們需要在A和B兩個集群的Longhorn中配置相同的backup target。

從應用商店的鏈接跳轉到longhorn UI,點擊 Setting > General 菜單,找到Backup分類,配置備份目標。

目前Longhorn支援NFS/S3兩種備份方式,在本例中,我們使用minio搭建了一個私有S3服務,這裡我們使用s3方式配置。

PS: 如果使用NFS,則需要保證NFS server支援NFSv4

部署MySQL應用

在集群A中部署一個MySQL應用,並在MySQL中創建測試表article並插入一條數據。

在集群A的Longhorn中對這個卷進行備份。

備份成功後,可以在集群B的Longhorn中看到備份資訊(因為兩個集群的Longhorn配置了相同的backup target,所以備份資訊是共享的)。

創建容災備份卷

訪問集群B的Longhorn UI,使用集群A的Volume的備份,在集群B中創建一個容災備份卷。

這裡Volume的名稱會根據備份卷自動填充,不建議手動修改

保存後,訪問 Volume 頁面可以看到我們新創建的容災備份卷。

在集群A的MySQL應用中再次插入幾條數據。

訪問集群A的Longhorn UI,對這個卷再次進行備份。這時可以看到集群B中的容災備份捲圖標變成了灰色,代表這個卷正在同步集群A中Volume的最新備份數據,此時無法激活和使用容災備份卷。

等待一會,圖標變成了藍色,代表已經與集群A中Volume的最新備份同步成功。接下來我們就可以使用這個卷了。

如果在集群A中對MySQL卷設置了自動備份,集群B中的Longhorn會定時輪詢最新的備份,將增量數據資訊自動同步到容災備份卷,以保持與集群A中Volume的數據一致。

在新集群中恢復mysql應用

假設此時我們的集群A已經無法使用了,我們可以在集群B使用最新的備份卷快速恢復MySQL應用。

首先,我們將集群B的容災備份卷激活。

等待卷狀態變成Detached以後,選擇創建PV/PVC。

這裡不建議修改PV和PVC的名稱,namespace可根據實際集群B中的namespace名稱進行填寫。保存會,會在集群B的指定namespace中創建PVC。

訪問Rancher可以看到PVC已經創建成功。

使用恢復的PVC創建MySQL應用,再查詢一下數據,可以看到數據也恢復過來啦!大功告成!

總 結

隨著雲原生應用的普及,越來越多的服務可以依託Kubernetes運行,保證服務的穩定性和可靠性也漸漸成為難題,依託Longhorn的跨集群容災備份功能,在Rancher中可以自動完成應用的編排、數據遷移,隨時優雅的切換業務應用運行環境。