開工第一天,我只巡檢到了晚上9點,飯碗是不是要沒了?

  • 2020 年 2 月 14 日
  • 筆記

我姓王,同事都叫我隔壁老王,這是有典故的。

我們技術總監就坐在我隔壁。每次網站掛了,同事們遠遠就能聽見總監的怒吼:「把隔壁老王給我叫來!」

所以大家都知道公司有個隔壁老王,老出Bug。

天知道我已經多久沒睡過囫圇覺了,我寧可用再單身十年來換公司系統的一生平安。

我每天比普通員工以及運維早半小時到公司,第一件事就是開始檢查數據庫的監控,進行數據庫巡檢,確認沒有問題或者及時發現問題並在上班時間之前解決問題。

現在特殊時期,在家遠程辦公,暫時從同事們的耳朵里消失的我,就再也沒和工作分開了。

今天是開工第一天,我穿着睡衣對着一大堆指標項、巡檢項以及冷冰冰的監控數據、日誌數據等,重複着第一輪巡檢過程。

比如:

數據庫環境,如操作系統資源、操作系統配置、數據庫軟件版本等。

數據庫配置,如數據庫參數配置、日誌配置等。

數據庫資源,主要分為空間資源、內存資源、進程資源等。

數據庫對象,如大表、大索引、無效對象是否合理等。

數據庫安全,如是否存在超級權限、弱口令用戶等。

數據庫性能,主要分析數據庫性能的變化趨勢及發展規律等。

數據庫災備,主要分析數據庫災備是否運行正常。

而如此忙碌的巡檢工作經常會被打斷,總是有突如其來的訪問性能問題或故障需要緊急響應,甚至要做一些臨時的應急操作。

我在app買的菜,葉子在小區門口晾了大半天都蔫了,也沒等到我去接它回家。

一整天的巡檢結束了,你以為我能喘口氣了?呵呵,為了我晚上能睡個安穩覺,我需要再次對高危數據庫進行2次巡檢,檢查數據庫監控和告警記錄,確認沒有問題後,終於可以放心給貓主子開個罐頭。

主子每天陪我熬夜都瘦了,我卻過勞肥又胖了幾斤。

晚上,終於有時間思考人生,回想這一天的工作,我好像只是做了巡檢??!!

沒等我感慨完被浪費掉的生命,系統告警聲把我拉回了電腦前。

我犧牲全部時間做的人肉巡檢,因為不可控因素太多和偶爾疏忽,遺漏了潛在隱患沒有解決,為了避免總監的奪命連環call,我精神高度緊張一遍又一遍的處理故障。

哎,今天洗頭又掉了兩根頭髮。

那是我最後的兩根。


老王,什麼事都靠自己干是不行的,人,總有累倒的一天。

智能巡檢

騰訊雲數據庫智能管家DBbrain提供了一鍵智能巡檢功能,內置AI專家系統輔助巡檢。數據庫自動化巡檢完成之後,AI專家系統實時評估巡檢結果,自動產生巡檢報告,確保巡檢報告的質量。此外,不同的運維場景有不同的巡檢需求,DBbrain能提供適應不同場景的巡檢報告,並能通過AI優化模塊,對巡檢中的異常、隱患等給出專家優化建議。

聽到你們小聲說開工第一天就打廣告了,朋友們,這不是廣告,這關乎到成千上萬DBA的人生幸福!

跟隔壁老王一樣,人肉巡檢讓DBA苦不堪言,巡檢項、巡檢結論完全取決於DBA技術能力,不同DBA巡檢同一套數據庫,巡檢結果可能會大相徑庭。而且數據庫越多,巡檢報告的質量往往越差,DBA越不容易發現問題。

有聰明的DBA做了腳本巡檢,編寫自動化腳本巡檢數據庫。由於巡檢腳本是固定的,因此腳本化巡檢能相對全面地巡檢數據庫,但腳本覆蓋的場景,以及能否從腳本執行結果中發現問題,仍受限於DBA的技術能力和經驗

智能巡檢時代,這些煩惱就通通煙消雲散了。

開工第一天,線上壓力驟然增加,對所有數據庫實例進行巡檢,將數據庫中的潛在風險提前識別出來是十分必要的,也是業務高峰期系統穩定運行的重要保障。

上面的截圖來自於DBbrain, 是騰訊雲自研的一款可為用戶提供數據庫性能、安全、管理等功能的智能運維平台。不認識DBbrain的朋友,點擊下方視頻兩分鐘即可了解:

DBbrain的健康報告功能日常可以幫助DBA高效率地進行數據庫健康巡檢,並便捷輸出實例巡檢結果,直觀反映出數據庫實例存在的異常、故障以及隱患,並且給出專家級優化建議。

那這個健康報告有什麼獨到之處嗎?

首先,可以為數據庫的健康狀況打分。將數據庫的核心監控指標(例如活躍連接數、CPU、內存、磁盤等)納入到評分模型中,同時也將結合數據庫的歷史異常率,慢日誌、死鎖、審計日誌等深層次分析找出潛在問題。

另外,這是在全程無人工干預的狀況下生成的健康報告。利用「健康報告」中發現的問題和優化建議,可以在流量洪峰前對數據庫進行優化。

最關鍵的,可以在根源上排查數據庫隱患。告別傳統擴容和升配,以優化為主升級為輔的方式,做到從根源上解決數據庫實例存在的問題和隱患。

報告主要包括介紹、基本信息、健康、實例狀態、異常診斷、慢 SQL 分析、大表分析以及性能曲線等章節。

值得一提的是,騰訊雲也是業內第一個提供微信移動端數據庫智能運維平台的雲廠商。通過DBbrain移動端微信小程序,DBA也可以輕鬆完成數據庫巡檢工作,還能夠通過「微信小程序數據庫日報推送」功能,訂閱每天的數據庫日報,時刻關注數據庫運行狀況。

在DBbrain的微信小程序端,提供如下核心功能:

• 實時診斷:7*24小時異常發現診斷,提供實時優化建議

• 慢日誌分析:慢SQL全方位分析優化,專家級優化建議

• 健康巡檢:一鍵生產數據庫巡檢報告,細粒度審查數據庫健康隱患

• 空間分析:數據庫空間使用一覽,AI預測助力

• 數據庫日報:微信推送數據庫每日運行狀態,全局掌握數據庫質量大盤

老王不用擔心,有了DBbrain這個好幫手,別說飯碗能不能保住,升職加薪都是小菜一碟啦~

往期推薦

↓↓點擊閱讀原文即刻體驗