數據科學中必須了解的Python基礎庫
- 2019 年 12 月 12 日
- 筆記

本文將介紹一些基礎的數據科學庫。
核心庫
Python有三個核心數據科學庫:
Numpy
Scipy
Matplotlib
第二代庫
Scikit-learn
是Python中的機器學習庫,專註於「核心」機器學習,包括結構化數據的回歸、分類和聚類。
Pandas
為了簡化Python中的數據分析。Pandas讓加載結構化數據、計算統計數據、切割數據變得非常容易。
Seaborn
可創建出漂亮的可視化數據。Seaborn是基於Matplotlib創建的,因此仍然可以使用Matplotlib功能增加或編輯Seaborn圖表。

深度學習
Pytorch
正逐漸成為研究和實現大量功能的標準深度學習庫,使其在數據生成用例中愈加完善。
Keras
第一個真正讓深度學習變得觸手可及的數據科學庫。同時還支持多個後端,即Tensorflow和CNTK。
Tensorflow
是由谷歌創建的,為深度學習的生產提供了很強大的支持。
統計
statsmodels
對統計模型和測試提供了很好的支持,甚至還支持很多R語法。
PyMC3
讓定義的概率模型變得非常直觀,並給許多先進的模型提供許多支持。