數據分析修鍊指南
掌握數據,就是掌握規律。當你了解了市場數據,對它進行分析,就可以得到市場規律。當你掌握了產品自身的數據,對它進行分析,就可以了解產品的用戶來源、用戶畫像等等。所以說數據是個全新的視角。數據分析如此重要,它不僅是新時代的「數據結構 + 演算法」,也更是企業爭奪人才的高地。接下來步入正題
一、什麼是數據分析
1、數據分析我們可以分成三個重要的組成部分
- 數據採集。它是我們的原材料,也是最「接地氣」的部分,因為任何分析都要有數據源。
- 數據挖掘。它可以說是最「高大上」的部分,也是整個商業價值所在。之所以要進行數據分析,就是要找到其中的規律,來指導我們的業務。因此數據挖掘的核心是挖掘數據的商業價值,也就是我們所談的商業智慧 BI。
- 數據可視化。它可以說是數據領域中萬金油的技能,可以讓我們直觀地了解到數據分析的結果。
2、詳細講解三部分
① 數據採集
通常會和數據源打交道,然後使用工具進行採集
工具:1、八爪魚 – 抓取 99% 的頁面源 2、py爬蟲
② 數據挖掘
知識型的工程,相當「演算法」部分。首先你要知道它的基本流程、十大演算法、以及背後的數學基礎 ,比如關聯分析,Adaboost 演算法等
掌握了數據挖掘,它會通過歷史數據,告訴你未來會發生什麼。當然它也會告訴你這件事發生的置信度是怎樣的,置信度這個詞你先記住就可以了,後面我們來學習它具體代表什麼。
③ 數據可視化
直觀的了解到數據分析的結果 – 萬金油
兩種方法:1、使用 Python。在 Python 對數據進行清洗、挖掘的過程中,我們可以使用 Matplotlib、Seaborn 等第三方庫進行呈現。
2、使用第三方工具。如果你已經生成了 csv 格式文件,想要採用所見即所得的方式進行呈現,可以採用微圖、DataV、Data GIF Maker 等第三方工具,它們可以很方便地對 數據進行處理,還可以幫你製作呈現的效果。
二、學習指南
把知識轉化為自己的語言,才能變成我們自己的東西 – 這個過程就是認知的過程。 認知比作大腦,工具則是雙手
1、MAS 學習法
- Multi-Dimension – 多個角度
- Ask – 不懂就問
- Sharing – 最好的學習就是分享
2、數據分析原則
- 不重複造輪子 – 大部分類庫就能滿足需求
- 工具決定效率 – 好的工具事半功倍
- 積累熟練度
3、建議
- 記錄每天的認知
- 用工具來表達你對知識點的掌握,並用自己的語言記錄下這些操作筆記。
- 做更多練習來鞏固你的認知
- 畫圖軟體SketchBook