在監控落地的路上,助你一臂之力

  • 2020 年 3 月 11 日
  • 筆記

是否,處於低谷期,而又不知道該學點什麼? 是否,想了解點技術輪子,而又無從下手? 是否,想讓線上的應用加上監控,拒絕線上應用裸奔? 是否,想讓線上的服務更加透明,而又不知道怎麼做?

近期,我們圍繞 Metrics 監控,進行了系列分享。

為了更清晰,本期就回顧一下,一回生二回熟,希望你能醍醐灌頂。

為了以後參考、查看方便,順道把往期分享中的思維導圖梳理成文,你一定要收藏呦。

Tips:

圖看不清,放大了去看,有秘密!

學以致用,它山之石可以攻玉!!

畫圖不易,轉發或收藏,你懂的!

1

知脈絡。

首先,我們結合《SRE Google 運維解密》,通過梳理監控系統的脈絡,知道一旦離開了監控系統,我們就沒法辨別一個服務是不是在正常提供服務,就如同線上的服務在瘋狂裸奔。

接著,把監控的術語重要的三種輸出做了梳理,最重要的是了解到業務監控的四個黃金指標。

(圖片來源於網路)

最後,把 Google 十餘年的監控實踐,也嘗試進行簡單梳理,對於後期落地實踐有一定參考意義。

思維導圖,讓你一覽無餘。詳情點這裡:如何做監控?Google SRE 解密

(圖看不清放大了去看)

2

定規範。

雖然對監控系統有了脈絡上的了解,但是線上跑的每一個應用,都需要配備一套監控系統,我們也知道,如果沒有一套設計周全的監控指標體系,也就如同蒙著眼睛在狂奔。

當下開源的監控輪子與日俱增,如果我們能提前了解規範,並按照其規範設計,那麼實現的系統與開源輪子將會無縫對接。

於是,我們就敞開心扉的聊了聊:指標監控的類庫 Metrics。

思維導圖,讓你一覽無餘。詳情點這裡:Metrics:如何讓線上應用更加透明?

(圖看不清放大了去看)

3

論實踐。

理論聊完,就是實現。

首先,我們走進當下最流行的流式處理框架 flink 的源碼,一起剖析了 flink 定義的 Metrics 介面規範,對 flink-metrics 有了全局的認識,並結合 flink-metrics-prometheus 對 flink 如何對 Prometheus 監控集成了如指掌。

思維導圖,讓你一覽無餘。詳情點這裡:實踐指路明燈,源碼剖析flink-metrics

(圖看不清放大了去看)

接著,我們引入了存儲 Metrics 數據的 InfluxDB 資料庫,花了一分鐘讓大家快速 get 時序資料庫的技能。

思維導圖,讓你一覽無餘。詳情點這裡:一分鐘 Get 時序資料庫 InfluxDB 的技能

(圖看不清放大了去看)

最後,基於 flink + InfluxDB + Grafana 進行輪子集成實戰,領會 InlfuxDB 該怎麼用?

大致流程圖,詳情點這裡:別人家的 InfluxDB 實戰 + 源碼剖析

4

(混元三教九流圖,來源於網路)

圖解:

正面是釋迦牟尼,一位和尚的影像是佛教的代表;

左側是孔子,頭戴方巾者為儒教的代表;

右側是老子,頭後挽個髮髻的則是道教的影像;

三教共存一碑,呈現一團和氣、一片圓融。

大道自然,順勢而為。希望大家都能把這些輪子,進行靈活集成運用,像混元三教九流圖一樣,到達運籌於心、從容自適。