數據分析修鍊指南

掌握數據,就是掌握規律。當你了解了市場數據,對它進行分析,就可以得到市場規律。當你掌握了產品自身的數據,對它進行分析,就可以了解產品的用戶來源、用戶畫像等等。所以說數據是個全新的視角。數據分析如此重要,它不僅是新時代的「數據結構 + 演算法」,也更是企業爭奪人才的高地。接下來步入正題

一、什麼是數據分析

1、數據分析我們可以分成三個重要的組成部分

  1. 數據採集。它是我們的原材料,也是最「接地氣」的部分,因為任何分析都要有數據源。
  2. 數據挖掘。它可以說是最「高大上」的部分,也是整個商業價值所在。之所以要進行數據分析,就是要找到其中的規律,來指導我們的業務。因此數據挖掘的核心是挖掘數據的商業價值,也就是我們所談的商業智慧 BI。
  3. 數據可視化。它可以說是數據領域中萬金油的技能,可以讓我們直觀地了解到數據分析的結果。

 

 

2、詳細講解三部分

① 數據採集

通常會和數據源打交道,然後使用工具進行採集

工具:1、八爪魚 – 抓取 99% 的頁面源  2、py爬蟲

 

 

② 數據挖掘

知識型的工程,相當「演算法」部分。首先你要知道它的基本流程、十大演算法、以及背後的數學基礎 ,比如關聯分析,Adaboost 演算法等

掌握了數據挖掘,它會通過歷史數據,告訴你未來會發生什麼。當然它也會告訴你這件事發生的置信度是怎樣的,置信度這個詞你先記住就可以了,後面我們來學習它具體代表什麼。

 

 

 

③ 數據可視化

 直觀的了解到數據分析的結果 – 萬金油
 兩種方法:1、使用 Python。在 Python 對數據進行清洗、挖掘的過程中,我們可以使用 Matplotlib、Seaborn 等第三方庫進行呈現。
      2、使用第三方工具。如果你已經生成了 csv 格式文件,想要採用所見即所得的方式進行呈現,可以採用微圖、DataV、Data GIF Maker 等第三方工具,它們可以很方便地對                  數據進行處理,還可以幫你製作呈現的效果。

 

 

 

 

 

 

二、學習指南

把知識轉化為自己的語言,才能變成我們自己的東西 – 這個過程就是認知的過程。 認知比作大腦,工具則是雙手​

 

1、MAS 學習法

  • Multi-Dimension – 多個角度
  • Ask – 不懂就問
  • Sharing – 最好的學習就是分享

2、數據分析原則

  • 不重複造輪子 – 大部分類庫就能滿足需求
  • 工具決定效率 – 好的工具事半功倍
  • 積累熟練度

3、建議

  • 記錄每天的認知
  • 用工具來表達你對知識點的掌握,並用自己的語言記錄下這些操作筆記。
  • 做更多練習來鞏固你的認知
  • 畫圖軟體SketchBook