小白學 Python 數據分析(15):數據可視化概述
- 2020 年 3 月 12 日
- 筆記
人生苦短,我用 Python
前文傳送門:
小白學 Python 數據分析(2):Pandas (一)概述
小白學 Python 數據分析(3):Pandas (二)數據結構 Series
小白學 Python 數據分析(4):Pandas (三)數據結構 DataFrame
小白學 Python 數據分析(5):Pandas (四)基礎操作(1)查看數據
小白學 Python 數據分析(6):Pandas (五)基礎操作(2)數據選擇
小白學 Python 數據分析(7):Pandas (六)數據導入
小白學 Python 數據分析(8):Pandas (七)數據預處理
小白學 Python 數據分析(9):Pandas (八)數據預處理(2)
小白學 Python 數據分析(10):Pandas (九)數據運算
小白學 Python 數據分析(11):Pandas (十)數據分組
小白學 Python 數據分析(12):Pandas (十一)數據透視表(pivot_table)
小白學 Python 數據分析(13):Pandas (十二)數據表拼接
小白學 Python 數據分析(14):Pandas (十三)數據導出
引言
從本篇開始,整個系列進入到第二部分,數據可視化。
那麼,什麼是數據可視化?
可以看下下面這個動圖,動圖來源阿里雲官網( https://data.aliyun.com/visual/datav )。
可以看到,這個動圖非常的炫,那我們是不是學了數據可視化以後就能做出來這種效果。
emmmmmmmmmmmm。。。。。。。。
這個難度有點高,打怪升級也沒有直接出門打 BOSS 的打法撒。
工欲善其事必先利其器
我們先看下現在使用的主流數據可視化的工具(類庫)有什麼。
Matplotlib
第一個當然是我們在前面開篇中介紹過的 Matplotlib , Python 數據分析經典三件套之一。
首先還是幾個官方網址羅列一下,防止有的同學找不到:
GitHub:https://github.com/matplotlib/matplotlib
官網:https://www.matplotlib.org/
中文網:https://www.matplotlib.org.cn/
Matplotlib 的安裝過程還是十分簡單的:
pip install matplotlib
等待進度條走完,我們就算安裝完成了。
在學習怎麼使用 matplotlib 之前,我們可以先看下 matplotlib 的一些示例:
錯了錯了,這麼複雜的圖我怎麼可能畫的出來。。。
下面這種才是我們的目標:
pyecharts
在除了可以使用 Matplotlib 作為數據可視化的工具之餘,我們還可以選擇 pyecharts 作為數據可視化工具。
先做一個簡單的簡介,以下內容來自官方文檔:
Echarts 是一個由百度開源的數據可視化,憑藉著良好的交互性,精巧的圖表設計,得到了眾多開發者的認可。而 Python 是一門富有表達力的語言,很適合用於數據處理。當數據分析遇上數據可視化時,pyecharts 誕生了。
相信很多同學對 Echarts 並不陌生,在做頁面圖表的時候,能選擇的第三方支援庫並不多,而 Echarts 是其中做的相當不錯的一個類庫,畢竟背後是由百度開源的。
放幾個官方的鏈接:
GitHub:https://github.com/pyecharts/pyecharts
接下來還是看如何安裝:
pip install pyecharts
和前面安裝 Matplotlib 一樣,靜靜的等待進度條走完就行。
這裡有關版本有一點需要注意,不管是使用 Matplotlib 還是使用 pyecharts ,都需要 Python 的版本是 3.x ,在官方文檔中都已經註明 2.x 不再進行維護。
至於小編為什麼要介紹 pyecharts 呢?給大家看幾個官方的示例:
是不是感覺單純的從 UI 設計的角度上來講, pyecharts 要比 Matplotlib 要好看的多,感覺 Matplotlib 像是上個世紀的產物。
在接下來的內容中,小編會先分享 Matplotlib 的使用,之後會專門寫幾篇介紹下 pyecharts 的使用。
數據可視化的基本流程
第一步:整理數據
數據還是數據可視化的基礎,在所有的事情開始之前,需要先明確需要把哪些數據圖表化。
第二步:明確目的
在上一步中,我們拿到了需要圖表化的數據,接著就需要想清楚,我們展示這些數據到底是為了什麼,是要表達一種趨勢,還是要展現對比等等。
第三步:選擇圖表形式
在明確了我們的目的之後,就需要選擇展現這些數據的形式了,我們需要為這些數據選擇合適的展現形式,這就需要分情況討論了。
例如我們想要展現一種趨勢,那麼折線圖就要比柱狀圖更為合適,如果是需要展現對比,那麼柱狀圖就要比折線圖合適,還有是展現百分比,那麼我們選擇餅狀圖就會更為合適。
本篇的內容就到這裡了,下一篇,我們接著介紹 Matplotlib 的使用姿勢。