[數據知識]IBM 數據治理成熟度評估模型

  • 2019 年 10 月 7 日
  • 筆記

本文介紹IBM 數據治理成熟度評估模型

  • 簡介
  • 成熟度等級
  • 模型介紹
  • 演進路線
  • 總結

簡介

數據被認為是推動企業增長和商業創新引擎的燃料。數據無疑被組織認定且擁有的資產之一,但是由於其海量數據的增加,複雜度隨之增加,管理和控制的難度越來越大。

  • 從結構化數據到非結構化數據。例如:客戶和員工數據、元數據、商業秘密、電子郵件、視頻和音頻等,組織需要找到一種行之有效的方法,在不影響業務正常運轉的情況下,按照業務數據需求管理;
  • 大量的數據零散在各個角落。當前較多組織的數據分佈在多個複雜的豎井式的各類應用系統中,這些數據彼此之間隔離,數據存在大量的冗餘和混亂不清,很少一部分數據參與跨部門的協同,缺少良好的數據治理和數據管理組織結構、角色和職責;
  • 企業期望利用信息獲得績效和利潤。組織期望通過評估數據資產,體現數據價值,並且期望通過數據運營支撐組織的商業決策和降低競爭中的風險。

正式由於以上的這些原因,數據治理已提升為企業戰略優先事項。

通常數據治理被認為是獲得高質量數據的核心控制規程,用於管理、使用、改進和保護企業數據加工過程中數據質量。有效的數據治理可以促進跨組織間的協調與決策,增強企業數據的可用、可信、可管、可控。企業關心的四個因素:

  1. 增加收入
  2. 降低成本
  3. 規避風險
  4. 數據可信

許多企業通過學習、培訓和借鑒經驗,開展自身的數據管理實踐,通過尋找行業基準和通用框架建立實施方法論。IBM 數據治理成熟度模型是由55人專家組成的專家委員會,通過計劃、設計、實施、驗證階段開展數據治理業務、技術、方法和最佳實踐,提出通過數據治理獲得一致性和高質量數據的成熟度模型,幫助組織有效改善數據管理環境,進而有效利用數據。

專家委員會提出當前組織面臨數據的主要問題,如下:

  • 缺乏跨職能數據治理組織結構和決策機制;
  • 缺乏數據風險和數據資產評估,導致業務目標與IT之間脫節;
  • 數據治理政策與數據需求管理、數據分析預測和數據質量報告等缺乏關聯;
  • 通用的數據存儲庫、規則、標準和過程,導致數據全生命周期管理存在數據風險;
  • 元數據管理和業務術語表,缺少對數據質量跟蹤,存在語義混淆,以及指標數據難以量化業務價值等問題;
  • 缺少有效的數據價值評估技術、風險評估工具支撐企業數據評估;
  • 數據模型管控長期處於事後管理,缺乏數據架構遵從性、體系結構完整性和實施部署的有效性。

成熟度等級

成熟度模型由Software Engineering Institute(SEI)在1984年開發,能力成熟度模型CMM(Capability Maturity Model)是一種用於開發和完善組織的軟件開發流程方法。CMM描述了五個等級的成熟度路徑:

  • Level 1 初始化 工作通常是臨時的,環境也不穩定,反映組織內個人能力,而不作為成熟度管理。該階段儘管組織內會生成產品和服務,但往往會超出預算和項目時間;
  • Level 2 已管理 基於項目或單業務職能的有效管理,能夠跟蹤成本和時間表,可以基於項目實踐的計劃和執行的經驗開展復用,但仍缺乏組織內整體的管理,仍然存在預算超支和實踐逾期等風險;
  • Level 3 已定義 組織內形成覆蓋整個組織的標準、流程和規程管理,能夠適應組織內業務職能或項目;
  • Level 4 量化管理 組織通過統計技術和量化分析,對所開展的質量目標進行量化管理;
  • Level 5 持續改進 量化的目標被明確建立且持續修訂反映業務目標的變化。

模型介紹

IBM 數據治理委員會提出數據治理能力成熟度模型,高階能力體現在四個方面:

  • 成效
  • 支持要素
  • 核心準則
  • 支撐準則

數據治理成熟度工作的推進者通常為企業的信息管理者,他們關注需要跨職能、跨流程、跨功能邊界的標準化,考慮信息生命周期中數據質量、數據安全的需求,針對組織級數據治理規程開展成熟度評估和管理,進而通過管理實現有效的協同一致性。

  • 數據風險管理,數據風險管理涉及的風險識別、量化、規避、接受和減輕等;
  • 價值創造,對數據資產進行的評估和量化過程,使得企業能夠最大化利用數據資產所創造的價值;
  • 組織結構與文化,描述業務、IT、數據之間的相互責任和組織結構,針對組織不同層級上的管理提出受託責任且做出承諾;
  • 數據管理,旨在確保組織獲得高質量數據資產,開展行之有效的數據管理,以降低風險和提升數據資產利用價值;
  • 政策,政策是組織期望獲得數據治理方面的行為、規範的書面化;
  • 數據質量管理,提供數據質量完整性、一致性、規範性等方法、測量和評估,進行改進和驗證;
  • 信息生命周期管理,基於生命周期的信息收集、加工、使用、保留和退役等;
  • 數據安全與隱私,描述組織風險防範和保護數據資產的策略、實踐和控制等;
  • 數據架構,企業及數據模型管理,提供完整的數據源接入、分類、存儲、流轉管理,提供可用的數據資產和數據共享開發;
  • 分類與元數據,用於業務和IT構建一致的可理解的術語、定義、分類和元數據管理、數據類型和存儲庫方法和工具。
  • 信息審計、日誌記錄與報告,用語度量和評估數據價值、風險和治理的有效性的過程。

演進路線

組織需要確認當前存在數據問題,才能開展有效的數據解決措施,最佳的方式是獲得數據管理能力提升演進路線:

  • 當前狀態:我們目前處於什麼位置?
  • 未來狀態:我們希望在未來什麼位置?
  • 演進路線:我們需要哪些人員、流程、技術和策略來填補當前和未來狀態的差距呢?

IBM數據治理成熟度模型的框架提供了當前和未來狀態之間的差距示例。執行數據治理成熟度評估的最佳方式是來至業務與IT的共同責任。

總結

數據治理已經成為世界各地組織的首要戰略重點之一。因此,整個行業對於數據治理的需求不斷增加,幫助企業獲得當前所處的階段和定位是尤其重要的。

IBM數據治理成熟度模型提供了一組基準和里程碑,幫助組織度量數據治理成熟度,通過成熟度級別、業務實踐和組織活動等要素,幫助組織利用成熟度模型開展整體的數據治理能力提升,確定今天我們在哪裡?—未來我們將去何處。