關於深度學習、NLP和電腦視覺的30個頂級Python庫
- 2020 年 12 月 15 日
- AI
譯者:AI研習社(話左)
請注意,下面的圖示由Gregory Piatetsky繪製,每個庫都有其類別,按星標和貢獻者對其進行繪製,符號大小則以該庫在Github上的提交次數的對數表示。
圖1:深度學習,自然語言處理和電腦視覺的頂級Python庫
按星級和貢獻者數量繪製;按提交數的對數表示相對大小
那麼事不宜遲 ,下面就是由KDnuggets員工精心挑選的30個可用於深度學習,自然語言處理和電腦視覺頂級Python庫。
深度學習
1. TensorFlow
星標:149000,提交數:97741,貢獻者:754
TensorFlow是針對機器學習的端對端開源平台。它具備綜合靈活的工具、庫和社區資源,可以幫助研究者推動先進的機器學習技術的發展以及開發者更輕鬆地開發和發布由機器學習支援的應用。
2. Keras
星標:50000,提交數:5349,貢獻者:864
Keras是由python編寫的機器學習API,其運行在機器學習的頂級平台TensorFlow上。
3. PyTorch
星標:43200,提交數:30696,貢獻者:1619
使用Python實現的張量和動態神經網路,並帶有強大的GPU加速。
4. fastai
星標:19800,提交數:1450,貢獻者:607
通過利用當下最佳的技術實踐,fastai極快地簡化了訓練過程也加速了神經網路。
5. PyTorch Lightning
星標:9600,提交數:3594,貢獻者:317
針對高性能AI研究的封裝輕量版PyTorch。可縮小你的模型,而不是提供小的樣板。
6. JAX
星標:10000,提交數:5708,貢獻者:221
Python+NumPy程式的組合變換:區分、向量化、在GPU/TPU上的JIT等等。
7. MXNet
星標:19100,提交數:11387,貢獻者:839
帶有動態和突變感知的數據流管理調度程式的輕量、便捷、靈活的分散式/移動機器學習庫:支援Python、R、Julia、Scala、Go、JavaScript等等。
8. Ignite
星標:3100,提交數:747,貢獻者:112
可靈活透明地訓練評估PyTorch神經網路的高級別庫。
自然語言處理
9. FastText
星標:21700,提交數:379,貢獻者:47
fastText是一個可高效學習單詞表意和句子分類的庫。
10. spaCy
星標:17400,提交數:11628,貢獻者:482
使用Python和Cython實現的工業級自然語言處理庫(NLP)
11. gensim
星標:11200,提交數:4024,貢獻者:361
gensim通過使用大型語料庫進行主題建模、文檔索引和相似性檢索。目標受眾是自然語言處理(NLP)和資訊檢索(IR)社區
12. NLTK
星標:9300,提交數:13990,貢獻者:319
NLTK——自然語言工具箱——是一整套針對自然語言處理研究和開發的開源Python模組、數據集和教程
星標:4300,提交數:568,貢獻者:64
用於自然語言處理的使用PyTorch,TensorFlow,NumPy和Pandas工具的快速,高效,開放式數據集和評估指標
星標:3800,提交數:1252,貢獻者:30
針對研究和生產的快速頂級的分詞器
星標:3500,提交數:5480,貢獻者:585
Transformers:針對Pytorch和TensorFlow 2.0 的頂級自然語言處理庫
16. Stanza
星標:4800,提交數:1514,貢獻者:19
針對很多人類語言的正式標準NLP Python庫
17. TextBlob
星標:7300,提交數:542,貢獻者:24
簡單,Python風格,文本處理-情感分析,詞性標記,名詞短語提取,翻譯等等。
18. PyTorch-NLP
星標:1800,提交數:442,貢獻者:15
用於PyTorch自然語言處理(NLP)的基礎實用工具
19. Textacy
星標:1500,提交數:1324,貢獻者:23
用於執行各種自然語言處理(NLP)任務的Python庫,構建在一個高性能spaCy庫之上。
20. Finetune
星標:626,提交數:1405,貢獻者:13
Finetune是一個庫,它允許用戶利用最新的預訓練NLP模型來執行各種下游任務。
21. TextHero
星標:1900,提交數:266,貢獻者:17
文本預處理、表示和可視化,從零到精通。
22. Spark NLP
星標:1700,提交數:4363,貢獻者:50
Spark NLP是建立在Apache Spark ML之上的自然語言處理庫。
23. GluonNLP
星標:2200,提交數:712,貢獻者:72
GluonNLP這個工具包,可簡化文本預處理,數據集載入和神經模型構建,以幫助您加快對自然語言處理(NLP)的研究。
電腦視覺
24. Pillow
星標:7800,提交數:10799,貢獻者:303
Pillow是個對用戶十分友好的PIL分支。PIL是Python影像庫
25. OpenCV
星標:49600,提交數:29453,貢獻者:1234
開源電腦視覺庫
26. scikit-image
星標:4000,提交數:12352,貢獻者:403
用Python做影像處理
27. Mahotas
星標:644,提交數:1273,貢獻者:25
Mahotas是個包含了最快的電腦視覺演算法(所有演算法用C++實現保證運行速度)的庫,針對numpy數組運行
28. Simple-CV
星標:2400,提交數:2625,貢獻者:69
SimpleCV是一個針對開源機器視覺的架構,使用了OpenCV和Python程式語言。
29. GluonCV
星標:4300,提交數:774,貢獻者:101
GluonCV提供了電腦視覺中最先進(SOTA)的深度學習模型。
30. Torchvision
星標:7500,提交數:1286,貢獻者:334
Torchvision包包含了流行的數據集、模型架構和電腦視覺中常用的影像轉換方法。
AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平台,致力成為中國最大的科技創新人才聚集地。
如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。