數字世界需要可視化
- 2020 年 3 月 6 日
- 筆記
在黑客帝國中,一邊是物理世界,一邊是母體的數字世界,數字世界由海量的1和0構成,只是0與1構成的世界對於大部分人來說過於複雜,最終只有救世主尼奧能夠看清:

而普通的人要認識母體這個數字世界,還需要轉化為這樣的模式,這是數字世界的N維的「可視化」過程。也可以這樣歸納,數據描繪現實世界,基於對數據掌握的程度,不同的人有不同的認識,而可視化是為了幫助人們了解得更深入,且更快捷。

【正題】
也許是因為攝影的原因,很早就對可視化感興趣,而與陳傲寒交流IT世界是否越來越複雜,以及可視化讓複雜世界更簡單的話題則進一步加深我對可視化的認知。本篇借上周翻閱邱南森所著的《數據之美》,梳理下數據可視化。《數據之美》書中帶有大量例子,作者用通俗的語言解釋了以數據為中心(注意不是數據驅動),利用可視化圖表作為原材料,來表達用戶的意圖,可視化讓用戶可以更快速、更簡單的了解數據深層次的含義。(註:以下部分內容非原書作者表達的意見,如需看作者的觀點需要翻閱原書)
1、數據可視化的原材料
本篇提到的可視化並不是表格類的原始數據的展現,重點指由文字與儀錶盤等方式組成的展示方式。通常來說,表格只能逐個對數據比較,而採用文字加儀錶盤等方式組織的數據可視化方式,可以快速看出一個數值與其它數值的關聯關係,且能有針對性的挖掘出更深層次的資訊。書中的作者對可視化組件進行抽象可以歸納為視覺暗示、坐標系、背景資訊三大類組件。通俗的講,視覺暗示是人們看到的主要部分,比如圖形、顏色、方向等等,坐標系和標尺可使其結構化,創造出空間感,背景資訊則賦予了數據以生命,使其更準確,更容易被理解,了解這三個抽象有助於我們在設計可視化時的保證資訊的完整性。
我們知道,不同的可視化圖表能帶來不同的視角,這其實與我們現實世界的可變化、不確定性相關。由於現實的複雜、可變性、不確定性,我們在對數據進行可視化時需要用多視角的方式對數據進行分析,比方說我們經常用總數、比例等數值作可視化的結果,但這些數值通常只能告訴我們被研究的對象當前的狀態,卻未能顯示出分布、關聯關係等資訊,採用另外的視角可以帶來一些全新的認識,比如用散點圖,可以發現獨立的離群值,通常少量的離群值可能是需要修正或特別注意的情況;一個帶有時間變化的曲線可以告訴你隨著時間推移發生的變化,並預示有好事或壞事將發生,周期性或規律性的事件則可以幫助你為將來做好準備……
註:數據可視化的圖表很多,以下摘錄一些常用可視化圖表的特點:

2、如何用好原材料
除了上面提到的採用多種視角去可視化數據外,我們還要善於在圖表中運用多元變數,以運維的故障分析為例,如果從故障數量的變化的曲線,你可以看到故障變化的趨勢,而如果在這個曲線可視化圖表中加入變更的數量曲線,可以得到更深的資訊,比如「變更很少但故障數多」,則研發團隊的應用版本品質可能是需要關注。我們還可以對多類數據進行比較,思考數據的背景資訊及其所表達的內容,並組織好形狀、色、周圍空間,使其更清楚。
背景資訊同樣很重要,尤其是當用戶不僅僅是自己時,就必須提供數據的背景資訊,才能讓那些不像你一樣了解數據的人也可以很容易理解圖表。要有一個好的背景資訊,可視化的分析人員必須要足夠用心,要讓可視化帶來思想,否則極容易出現為了可視化而可視化,配上精心設計的標籤、標題、文字。同時,排版、背景資訊、合理布局也可以為原始統計數據增加一層資訊。
建立視覺層次也很重要,用醒目的著色突出顯示數據,淡化其它視覺元素,把它們作為背景是一個好辦法,這有助於建立起一個視覺層次,幫助讀者快速關注到數據圖形的重要部門,而把周圍的東西當作背景。另外,採用主次鑽取的方式也是一個好辦法,即建立一張圖作為全景,將細節由全景圖進行鑽取。
用數據來講故事,年初看過一個tableau的介紹PPT,裡面有一個關於故事的設計挺有趣,tableau採用一種故事導覽的按鈕,把多個看板串起來講述故事,用故事的方式有助於提出背景,介紹問題,然後再用可視化回答問題,這個過程中可以讓用戶準確的切入焦點。同樣,在一個看板中我們也可以考慮加入文字將圖表串起來,不過常用的可視化工具中並沒有提供這種解決方案,這個值得期待。
3、動手試試可視化
只要有數據,一切皆能可視化。
也許是因為對數據的敬畏心太高,又或許是因為對數據缺乏認識,工作中我們很少看到大家用數據提升工作效能。但實際上,我們只要多花一點點心思,往往就能有很大的效益,而且難度可能也不大,並不需要什麼複雜的演算法。以下的方法結合知乎等渠道的知識來源進行總結:
- 先明確為什麼要數據可視化,不要為可視化而可視化,弄清楚你要用數據可視化表達什麼。
- 梳理一個家底,看看有什麼數據,研究數據代表什麼,是否有些角度需要深入探索,是否要進行多元變數的數據關聯。這個階段先不要過多關注布局與美學,先注意效率,準確度。
- 上面兩個步驟後就知道了要展示什麼,這時就可以琢磨如何展示。剛開始可以先不用花太多時間在電腦畫圖上,可以直接先在白紙上畫。不斷嘗試,尋找資訊圖最優表現形式,選用合適的形狀、顏色,布局。
- 最後才是視覺風格,在視覺風格格上注意抓大放小,先定下來最主要模組的風格,再做根據需要添加、完善細節。
4、數據可視化常遇到的問題
作為數據可視化的設計人員,需要讓用戶能夠更快,更簡單的理解數據,這就要求我們能夠在可視化中指出有趣的方向,提供背景知識,確保用戶始終關注焦點。在一些項目的可視化環節中,我也犯過「為可視化而可視化」,說到底是因為在可視化設計中不夠用心,一是沒有明確好要用數據表達什麼;二是沒有讓可視化圖表體現思想,比如數據的背景交待不清,標題不準確,沒有注釋,不重視顏色的選擇等等問題。總之,要更好的進行數據可視化,一定要總夠用心,本著數據可視化是為了讓人更便捷的了解複雜的數字世界的心態,去挖掘數字世界。
以下再補充一些常見應用圖表不正確的問題:

註:書的內容如下:
https://item.jd.com/11410004.html