數據的廣度、深度、精度、新鮮度、長度決定了數據的基礎價值
- 2019 年 10 月 10 日
- 筆記
數據土壤是否足夠肥沃,取決於數據的廣度、深度、精度、長度和新鮮度,肥沃的土壤就像亞馬遜叢林,滋養萬物。
數據價值取決於應用。數據不是越多越好,就跟油田一樣,光有油沒用,得把油挖出來,這就需要去探查油田的內部結構,去建設好的數據體系,讓數據易於獲得、應用,且成本最小化。
一項關鍵數據的價值頂過一堆數據堆砌,數據應用的話題下次討論。
今天先討論什麼決定了數據的油品,數據的廣度、深度、精度、新鮮度、長度決定了數據的基礎價值。

以一輛車為例來說明他們的含義。
1
廣度指數據覆蓋面,尤其關鍵資訊應有盡有。以車為例,一輛車就是一個ID,尤其關鍵資訊都要有,如:
•車型:如品牌、型號、配置
•銷售記錄:如銷售時間、價格
•保養記錄:保養時間&內容
•使用記錄:如里程、維修記錄
•保險記錄:出險記錄
•……
2
深度是指數據所觸達的程度,以車的使用記錄為例,深度數據需要包含下面的資訊:
•行駛總公里數
•日常行車路線、路況
•維修次數
•維修內容
•維修點
•……
比如說這輛車維修過3次,和這輛車在4S店維修過3次,這兩個資訊的價值就完全不一樣。
3
精度指單一指標的精準度,越精準就越明確,無論是分析還是產品化的價值就更顯性化,反之,指標越模糊,分析、產品化的價值就要打折,難度也加大。
以一輛車的車價為例,不同精度的表達方式:
•大區間描述:售價車價在10-20萬之間
•模糊區間描述:車價在15-20萬之間
•精準描述:車價為18.8萬
有了精準的車價,無論是面向消費者的提供購車、轉讓資訊查詢,還是面向汽車服務機構的車輛估值、授信評判都極為重要,不但資訊可用了,也會極大提高人效。
4
數據的新鮮度就跟家庭買菜一樣,新鮮的蔬菜營養價值總會更好,清晨剛從菜地里採摘下來的蔬果,更為新鮮爽口,更受家庭青睞。很多家庭不會吃上周的蔬菜,因為菜可能已經蔫了、壞了。
對於數據來說,它的新鮮度體現在:
•數據的更新時效:每天更新、每周更新、每月更新。比如雙11淘寶成交的數據大屏都是實時數據。放在古代,數據、資訊傳遞都要通過驛站、快馬來實現。隨著現代技術的越來越發達,資訊扁平化、實時化,決策也越來高效
•數據的時效:數據的時效體現在今天看到是今天、昨天、還是前天,或者上周的數據,即使每天更新的數據,也未必是最新鮮的數據。
數據的更新機制,背後往往是系統的工作機制、數據對接的機制。
5
數據長度,也就是擁有多長時間周期的數據,一天、一周、一個月、一年、五年還是十年。
不是所有數據都需要長周期,但需要滿足基本的經營觀察周期的數據,如同比、環比。部分有特定需求的數據,比如實驗室的個體跟蹤數據,就需要長周期,經濟大周期也需要長周期,幾十年甚至上百年的數據。