優秀的銀行和電商是這樣用資料庫的

  • 2019 年 12 月 17 日
  • 筆記

12月14日,騰訊雲與知數堂聯合舉辦的3306π年會·深圳站在騰訊濱海大廈舉行,騰訊雲TDSQL首席架構師張文和騰訊雲高級產品經理劉迪受邀分享,和與會者共同探討資料庫的行業應用和AI時代下未來資料庫運維的發展趨勢。

關注「騰訊雲資料庫」官方微信,回復「1214」即可下載本文分享的PPT。

張文在主會場分享了TDSQL在銀行傳統核心系統的應用實踐。銀行的核心系統相當於銀行的大腦,所有和錢有關的交易都需要經過核心系統,完成資金的清算核算。換句話說核心系統需要和其他所有關於錢的系統打交道,因而它的業務邏輯也最為複雜、最為關鍵,它直接影響著銀行核心資產相關的數據。

2019年TDSQL成功應用到張家港銀行新核心系統,把張家港銀行的核心系統資料庫從集中式升級成分散式,成為中國第一家投產於銀行傳統核心系統的分散式資料庫,這是TDSQL又一個里程碑式的發展。

劉迪做了題為《無人值守時代的資料庫智慧運維》的分享,劉迪提到資料庫運維的演進可以劃分為石器時代、工具時代、專家時代和智慧時代。資料庫無人值守模式的演進是業務和開源技術共同驅動下的產物,以多年的資料庫運維實踐為基礎,隨著AI技術在資料庫運維領域的不斷深入而水到渠成的。

騰訊在探索資料庫智慧運維的過程中,經歷了運維人工化、運維工具化、基礎平台化、高級自動化和服務智慧化5個階段,騰訊雲資料庫智慧管家DBbrain應運而生。DBbrain從內部騰訊新聞、騰訊影片、騰訊體育的業務中經歷了萌芽期後,逐漸的成熟開啟支援微信紅包、財付通、QQ、Qzone等內部業務,隨後孵化為雲服務,開始服務於私有雲和騰訊內部自研上雲業務線,今年8月完成品牌升級和發布,將資料庫智慧化能力賦能給更多的客戶。

DBbrain具備實時診斷優化、安全高效、效果可預見、掌上管理、AI助力、多場景兼容的6大特性,會上,劉迪結合今年雙十一DBbrain支援騰訊雲上電商客戶大促的案例為大家深入解讀了DBbrain的系統架構、核心功能、優化策略、處理邏輯、AI能力以及評價規則。

電商大促的保障工作為備戰準備、大促保障、節後復盤三個階段,DBbrain可為電商客戶在每個階段都提供智慧化的資料庫保障,例如:健康巡檢、資源評估、優化改造、監控大屏、故障處理、應急止損以及經驗總結等。在備戰準備階段,DBbrain提供了健康報告功能,將資料庫的核心監控指標(例如活躍連接數、CPU、記憶體、磁碟等)納入到評分模型中,同時也將結合資料庫的歷史異常率,慢日誌、死鎖、審計日誌等深層次分析找出潛在問題,綜合給資料庫的健康狀況進行打分。用戶可以利用「健康報告」中發現的問題和優化建議,在大促前對資料庫進行優化,然後不斷巡檢和優化,將資料庫中存在的風險點一個個修復,提升資料庫整體的性能和穩定性,告別傳統擴容和升配的保障方式,以優化為主升級為輔的方式做到從根源上解決資料庫實例存在的問題和隱患。

在電商大促進行時,傳統的監控很難提供一個關注所有資料庫實時狀態的全局視野。DBbrain針對這一行業痛點,為用戶提供了「全實例監控」、「全實例概覽」功能,展示全資料庫實例維度(用戶整體視角)的監控指標。統一監控視圖裡展示所有實例(9宮格和36宮格切換)監控指標的橫向視圖,便於用戶查看和發現資料庫異常問題,提高運維效率。在出現致資料庫實例異常時,DBbrain能夠秒級發現故障、定位原因,並給出優化方案建議,幫助用戶第一時間處理問題和恢復業務,儘可能減少資料庫異常對業務訪問的影響時間。DBbrain還可以在緊急關頭做到真正的業務止損,幫助業務完成資料庫降級。比如某類SQL並發急劇上升、有數據傾斜SQL影響正常業務、未創建索引SQL造成整體系統繁忙等。針對以上的場景,DBbrain提供的「SQL限流」可快速拒絕異常請求,實現業務降級,保障核心業務的訪問順暢。

未來的智慧運維會圍繞著自我優化、計劃修正、引擎融合、自動調優、失控SQL自治等幾個方向發展,騰訊雲資料庫智慧管家正在朝著這個方向不斷演進。而在此過程中,傳統資料庫運維的核心競爭力也從拼體力到編寫腳本工具,再到基礎平台的研發能力,將專家經驗自動化複製,主動幫助業務提升穩定性和性能。進入無人值守的時代,傳統的運維工程師將不需要消耗精力在基本的性能優化、問題發現和數據收集工作上,一方面可以更好的聚焦於複雜的資料庫問題,不斷完善和推動運維服務智慧化進程,更重要的是能夠聚焦於業務邏輯架構,優化架構設計,實現更高價值。

往期推薦

(點擊圖片即可跳轉閱讀)

↓↓點擊閱讀原文,免費體驗DBbrain